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内 容 简 人 


本 书 对 现代 计算 机 的 数据 结 徇 和 算法 进行 全 面 而 深入 的 介绍 。 

本 书 系统 地 介绍 了 常用 的 数据 结构 和 计算 机 算法 ,精心 设计 和 安排 了 全 书 内 容 , 适 用 于 各 类 
畦 次 的 读者 。 即 使 是 初学 计算 机 算法 的 读者 也 可 以 从 本 书 中 找到 所 需 的 资料 。. 

来 书 的 每 一 章 中 给 出 一 个 算法 .一 种 设计 技术 ,一 个 庶 用 领域 或 -- 个 相关 的 话题 。 算 法 是 以 
通 榕 的 语言 说 明 的 ,并 以 * 伪 代码 ”的 形式 来 设计 ,可 以 很 容易 地 把 它 转化 为 计算 机 程序 用 于 有 关 
的 应 用 ,其 中 用 了 260 多 幅 图 来 说 明 算 落 是 如 何 工 作 的 ,并 对 所 有 算法 都 进行 仔细 ,精确 的 运行 
时 肇 分析, 等 法 尽量 设计 得 易于 理解 ,趣味 性 强 。 

本 书 里 顾 到 了 通用 性 与 系统 性 , 涵 闵 了 许多 方面 的 内 容 , 包 括 800 多 个 练习 和 120 个 思考 
题 ,因此 也 可 以 作为 高 年 级 本 科 生 和 研究 生 的 (如 “数据 结构 "算法 分 析 与 设计 ”等 ) 教 秒 和 教学 
萝 考 节 。 

本 书 篇 幅 较 大 , 钵 盖 范 围 广 ,是 一 本 关于 计算 机 数据 结 丢 和 下 法 的 工具 书 ， 读 者 可 以 选择 三 
课程 有 关 的 音节 进行 阅读 。 本 书 既 可 以 作为 教科 书 使 用 ,又 可 以 作为 工程 技术 手册 或 参考 书 使 
用 。 
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出 版 者 的 话 : 


我 国 福 会 主义 色 济 建设 的 莲 友 发 展 ， 极 大 地 推动 着 社会 信息 化 的 进程 ， 也 促进 了 信息 产 
业 的 发 展 。 现 在 ， 计 算 机 的 应 用 已 渗透 到 社会 和 生活 的 各 个 领域 。 作 为 社会 信息 化 基础 的 计 
算 所 及 款 件 技术 ， 正 为 趋 来 趟 多 的 人 掌握 和 应 用 ， 计 算 机 芝 轶 件 技 术 也 因此 而 不 斯 更 新 、 发 
展 。 

掌握 计算 机 技术 ， 是 现代 人 特别 是 跨 记 纪 的 中 青年 人 在 当今 激烈 的 社会 竟 刍 中 制胜 的 基 
砧 ， 也 是 末 来 信息 化 社会 对 每 个 人 的 要 求 。 航 而 ， 在 我 国 ， 计 算 机 基础 教育 尚 太 普 及 ， 计 算 
机 特别 是 徽 型 计算 机 及 软件 技术 的 应用 和 开发 也 还 处 在 一 个 较 低 的 层次 。 许 多 非 专 卫 人 员 和 兰 
望 能 使 用 计 兽 机 ， 但 面 对 和 纷繁 的 专业 知识 ， 众多 的 技术 资料 ， 视 学 习 计算 机 的 使 用 为 如 途 ， 专 
业 人 员 面 对 软件 技术 的 快速 更 新 ， 目 不 暖 接 。 为 了 让 更 多 的 人 数 意 计算 机 枝 术 ， 科 用 计算 机 
服务 于 自己 的 管理 、 衬 研 、 坟 学 工作 ， 便 我 国 的 计算 机 肥 软 件 技术 的 应 用 和 开发 紧 随 国际 潮 
流 ， 普 及 和 提高 我 国 计 算 机 应 用 和 开发 的 水 平 ， 我 们 为 此 组 织 锁 号 并 陆续 出 版 《计算 机 及 霓 
件 转 术 具 书 》。 

本 《人 替 书 》 将 以 应 用 为 基础 ， 姜 顾 普 及 与 提高 。 组 织 科 研 、 孝 学 和 应 用 开发 第 一 线 的 专 
家 、 学 者 ， 结 合 国外 计算 机 及 软件 技术 的 最 新 发 展 和 趋向 与 国内 的 应 用 现状 和 方向 ， 为 初学 
者 提供 来 统 的 入 门 读物 ， 为 专业 人 员 介 绍 送 合 国情 的 最 新 实用 盾 术 ， 既 有 理论 性 、 学 术 性 强 
的 专著 ， 专 论 ， 也 有 普及 性 、 实 用 性 的 教材 、 手 册 ， 以 满足 多 层次 读者 前 需要 。 

本 《丛书 》 的 编写 特 立 足 于 现实 ， 着 眼 于 林 来 ， 力 争 友 贞 国 内 针 计 算 机 亚 坎 件 技术 的 最 
新 动态 和 发 展 赵 向 ， 引 导 和 帮助 读者 学 习 、 吸 收 、 掌 握 计 算 机 的 新 理论 、 忆 技 术 和 新 或 果 。 

我 们 将 根据 读者 需要 ， 不断 充 实 、 完 善本 《从 书 》 内 容 ， 同 时 诚 鳄 欢迎 读者 对 本 他 区 
书 》 提 出 建议 、 灿 评 ， 也 芍 忱 欢迎 向 本 《丛书 》 肠 稿 。 
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中 


前 


径 过 两 年 多 的 努力 , 《现代 计算 机 常用 数据 结构 及 算法 》 一 书 终于 脱 稿 付 樟 了 。 现 就 我 
们 编译 本 书 的 目的 、 本 书 的 特点 、 本 书 的 组 织 及 内 容 安排 、 本 书 的 用 途 及 使 用 方法 等 作 一 些 
简要 的 说 明 。 


一 、 目 的 


数据 由 数据 元 素 组 成 ， 数 据 元 素 可 以 是 一 组 ”事实 "， 一 批 * 数 ?或 者 一 个 “符号 "集合 ， 等 
等 。 作 为 计算 机 程序 加 工 处 理 的 对 象 的 数据 ， 并 非 是 一 堆 无 组 织 的 信息 元 素 ， 它 们 包含 的 数 
据 元 素 之 间 有 着 重要 的 结构 关系 .数据 结构 就 是 对 数据 元 素 之 间 的 结构 关系 的 一 种 描述 ， 算 
法 则 是 解决 数据 结构 问题 的 办 法 。 本 书 中 的 结果 都 集中 地 以 算法 形式 给 出 。 实 际 上 ， 设 计 计 
算 机 程序 ， 就 是 要 在 计算 机 上 实现 某 种 算法 。 算 法 是 用 摘 述 语 育 描 述 的 程序 ， 而 程序 则 是 儿 
计算 机 所 能 接受 的 语言 编写 的 算法 。 因 此 ， 对 于 从 事 计算 机 应 用 的 科技 人 员 来 说 ， 不 仅 要 党 
握 作 为 程序 开发 工具 的 程序 设计 语言 ， 还 要 掌握 算法 。 算 法 是 程序 设计 的 基础 。 为 此 ， 我 们 
根据 国内 外 的 最 新 资料 编译 了 本 书 。 


二 、 特 点 


本 书 可 概括 为 以 下 几 个 方面 的 特点 ; 

1. 概 念 清晰 ， 广 度 、 深 度 兼 顾 。 

本 书 收集 了 现代 计算 机 常用 的 数据 结构 和 算法 ， 并 作 了 系统 而 深入 的 介绍 。 对 涉及 的 概 
念 和 背景 知识 都 作 了 清晰 的 阐述 和 交代 ， 有 关 的 定理 给 出 了 完整 的 证 明 ， 

2.“ 五 个 一 ”的 描述 方法 。 

本 书 以 相当 的 深度 介绍 了 许多 常用 的 数据 结构 和 有 效 的 算法 。 编写 上 采用 了 “五 个 一 "的 
描述 方法 ， 即 一 章 介绍 一 个 算法 、 一 种 设计 技术 、 一 个 应 用 领域 和 一 个 相关 话题 。 

3. 图 文 并 茂 ， 可 读 性 强 。 

书 中 的 算法 均 以 通俗 的 语言 进行 说 明 ， 并 采用 了 260 多 幅 图 来 说 明 算法 是 如 何 工作 的 ， 
易于 理解 

4. 算 法 的 . 斧 代 码 * 形 式 简明 实用 。 

书 中 的 算法 均 以 非常 简明 的 * 伪 代码 "形式 来 设计 ， 可 以 很 容易 地 把 它 转化 为 计算 机 程 
序 ， 直 接 用 于 有 关 的 应 用 。 

由 于 注重 了 算法 设计 的 效率 ， 故 对 所 有 算法 进行 了 仔细 、 精 确 的 运行 时 刻 分 析 ， 有 利于 
进一步 改进 算法 。 


三 .内 容 - 


全 书 内 容 共 分 七 篇 三 十 七 章 。 各 篇 有 主要 音节 的 安排 如 下 。 

第 一 篇 共 六 章 〈i-6)， 介 绍 算法 设计 和 分 析 使 用 的 教学 知识 。 

算法 分 析 常 常 需要 用 到 一 些 数 学 知识 ， 其 中 一 - 些 可 能 很 简单 ， 只 要 用 到 高 中 代数 的 知 

5 但 也 有 一 些 相对 来 说 是 比较 复杂 的 。 本 书 的 这 一 部 分 内 容 将 对 分 析 算 法 的 各 种 方法 与 工 
员 人 简 菇 个 细 。 以 供 读者 参考 查阅 。 四 

第 二 篇 共 四 章 (7~10)， 介绍 排序 和 顺序 统 计 学 ， 在 这 部 分 中 ， 介 绍 了 另外 冰 补 对 任 才 
奖 数 排序 的 算法 ， 即 堆 排 序 和 快速 排序 。 同时 对 另外 两 个 相关 算法 即 基数 排序 算法 和 三 排 
于 了 分 析 。 
。 第 三 篇 共 五 章 (11-15)， 描述 了 几 种 用 来 实现 动态 集合 的 数据 结构 . 例如 ， 处 理 简单 
数据 结构 如 栈 、 链 表 ， 有 根 树 以 及 困 姿 表 、 二 查找 树 、 红 - 黑 树 和 增强 红 - 黑 树 等 的 革 本 
方法 和 狐 作 ， 这 些 数 据 结构 可 以 用 来 构造 一 些 高 效 的 算法 。 

第 六 篇 用 三 章 “fl6-18) 的 篇 加 介绍 了 设计 和 分 析 高 效 算 法 的 三 种 重要 技术 : 动态 程序 
变 计 全 心算 法 和 平反 技术、 这 部 分 的 技术 对 有 效 电解 交 许 多 计算 问题 是 至 关 重 要 的 。 


第 大 篇 共 二 带 -(23<27j， -要 讨论 呆 关 何在 计算 的 上 轩 过 图 以 及 以 此 为 项 的 广度 
先 搜 索 和 深 产 优 先 抛 索 算法 ; 如 何 生 成 -- 个 图 的 最 小 权 生 成 树 ; 赋 权 图 中 顶点 间 最 短路 径 和 
网 络 站 最 头 流 的 计算 同 题 。 网 络 问题 党 以 多 种 形式 出 现 ， 掌握 计算 最 大 流 的 一 种 好 的 算法 对 
于 多 各 多样 的 丰 关 问题 将 是 非常 有 益 的 。 ， 

第 七 简 用 了 十 章 〈28-37)》 的 篇 彤 对 _ 上 等 法 课题 进行 了 讨论 ， 这 些 课题 是 对 前 面 各 篇 
材料 的 扩展 和 补充 ， 介 绍 了 -一 些 新 的 算法 ， 如 比较 网 络 :组合 电路 和 了 PARM 等 三 种 并 行 计 - 
算 模 型 ， 抑 阵 操 作 的 有 效 算 法 和 -种 著名 的 信号 处 理 技术 (快速 传 里 叶 变 换 ，FEIJ。 此 
外 ， 还 讨论 了 算法 应 用 的 特殊 领域 ， 如 计算 几何 和 数论 ， 阁 对 设计 有 效 竺 拱 所 受 的 一 些 限制 
和 克服 这 些 跟 制 的 相 庶 技 术 翰 行 了 探讨 : 


四 用: 放 


: 1. 适 合用 于 教材 或 教学 参考 书 。 本 

由 于 环 韦 兼 厂 往 用 性 与 系统 性 ， 杜 盖 了 许多 方面 的 内 容 ， 六 此 ， 对 教师 而 言 ， 可 选 作 为 
六 等 学 校 高 年 级 本 科 生 和 研究 生 的 多 门 课程 (如 "数据 销 构 "算法 分 析 与 设计 "等 ) 的 教材 
了 教学 参考 书 。 本 蔬 不 但 阐述 通俗 ， 严 洪 ， 而 且 还 提供 了 800 多 个 练 避 和 120 多 个 思考 古 : 
计 革 每 一 节 的 内 容 都 给 出 于 数 入 和 难度 不 等 的 练 导 题 ,练习 题 用 作 考 察 对 基本 材料 掌握 各 
度 ， 思 考题 有 一 定 的 难度 , 需 进 行 精心 的 研究 ， 有 时 还 通过 思考 感 介 绍 一 些 新 的 知识 。 

在 适用 于 研究 生 的 章节 舟 练 卫 前 标 . 上 了 一 :个 星 号 ， 这 年 不 意味 着 化 未 标 星 号 章节 或 练习 
礁 ，、 只 是 它 本 能 需要 用 到 更 多 的 背景 知识 和 数学 知识 . 

对 学 生来 说 ， 本 书 是 学 习 算 法 的 一 本 很 好 的 参考 材料 。 示 书 的 算法 都 尽量 设计 得 容易 理 


解 ， 并 且 也 比较 有 趣 。 在 过 到 一 个 不 熟悉 的 算法 时 ， 我 们 一 步 一 步 地 说 明 它 ; 同时 还 提供 对 
理解 算法 的 分 析 所 需 的 数学 知识 的 详细 说 明 。 如 果 读 者 对 某 个 课题 有 了 一 定 的 了 解 ， 就 可 以 
跳 过 该 节 的 简介 部 分 , 直接 去 读 更 高 级 的 部 分 。 

2. 作 为 工程 技术 手册 和 参考 书 。. 

对 于 工程 技术 人 员 来 说 ， 由 于 本 书 的 末 瘟 范围 很 广 ， 涉 及 专题 的 内 容 比 较 全 面 ， 因 此 它 
是 一 本 关于 计算 机 数据 结构 和 算法 的 非常 好 的 参考 手册 . 

3. 作为 工具 书 。 四 

由 于 本 书 收 集 的 数据 结构 和 算法 都 是 比较 常用 的 、 典 型 的 、 高 效 的 、 成 熟 的 ， 短 时 间 内 
不 会 过 时 ， 故 本 书 具 有 很 好 的 收藏 价值 。 


五 .用 法 


本 书 对 内 容 进 行 了 精心 的 设计 和 安排 ， 尽 可 能 考虑 到 所 有 水 平 的 读者 。 即 使 是 初学 计算 
机 算法 的 人 也 可 以 在 本 书 中 找到 所 需 的 材料 ， 而 不 必 理 会 其 中 的 数学 证 明 。 

由 于 每 一 章 都 是 自 解释 的 ， 因 此 读者 只 需 将 注意 力 集中 到 最 感 兴趣 的 章节 即 可 。 

对 于 选 作 教材 使 用 的 教师 和 学 生来 说 ， 选 择 使 用 与 课程 有 关 的 那些 章节 倍 读 。 


本 书 编译 工作 由 潘 金 贵 、 件 仁 、 顾 铁 成 主持 和 组 织 ， 参 加 本 书 编译 工作 的 主要 人 员 有 顾 
铁 成 、 曾 俭 ， 葡 瑞 英 、 公 妙 凤 、 腾 远方 、 陈 昕 、 朱 训 庄 、 张 岗 、 皇 仁 、 潘 金贵 、 张 宁 、 吴 卫 
华 、 欣 超 、 胡 学 联 、 辛 达 雅 、 史 欣 等 二 十 位 同志 ， 由 顾 铁 成 、 潘 金贵 和 件 仁 同志 负责 了 全 书 
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第 一 篇 ”基础 知识 


在 学 习 本 篇 的 内 容 时 , 我 们 建议 读者 不 必 一 次 将 这 些 数学 内 雁 全 部 消化 。 先 浏览 一 下 这 
部 分 的 各 章 ， 看 看 它们 包含 哪些 内 容 ， 然 后 直接 去 读 集 中 谈 算 法 的 章节 。 在 阅读 这 些 章节 
时 ， 如 果 需 要 对 算法 分 析 中 所 用 到 的 数学 工具 有 个 更 好 的 理解 的 话 ， 再 回 过 头 来 看 这 部 分 。 
当然, 该 者 也 可 顺序 地 学 习 这 几 章 ， 以 便 很 好 地 掌握 有 关 的 数学 技巧 

本 篇 各 章 的 内 雁 安排 如 下 ， 

第 一 章 介绍 本 书 将 用 到 的 算法 分 析 和 设计 的 框架 。 

第 二 章 精 确定 义 了 几 种 渐 近 记号 , 其 目的 是 使 站 者 采用 的 记号 与 本 书 中 的 一 致 ， 而 不 在 
于 向 读者 介绍 新 的 数学 概念 。 

第 三 章 给 出 了 对 和 式 求 值 和 限界 的 方法 ， 这 在 算法 分 析 中 是 常常 会 过 到 的 。 

第 四 章 将 给 出 解决 递归 式 的 用 种 方法 。 我 们 已 在 第 一 章 中 用 这 些 方法 分 析 了 合并 排序 ， 
后 面 还 将 多 次 用 到 它们 。 一 种 有 效 的 技术 是 “ 主 方法 *， 它 可 被 用 来 解决 分 治 算法 中 出 现 的 递 
归 式 。 第 四 章 的 大 部 分 内 容 花 在 证 明 主 方法 的 正确 性 ， 读 者 若 不 感 兴 趣 可 以 略 过 。 

第 五 章 包 售 了 有 关 和 集合、 关系 、 函 数 、 图 和 树 的 基本 定义 和 记号 。 这 一 章 还 给 出 了 这 些 
数学 对 象 的 一 些 基本 和 性质。 如 果 读 者 已 学 过 离散 数学 课程 ， 则 可 以 略 过 这 部 分 内 容 。 

第 六 章 首先 介绍 计数 的 基本 原则 , 即 排列 和 组 合 等 内 容 。 这 一 章 的 其 余部 分 包含 基本 概 
率 的 定义 和 性 质 . 


第 一 章 “算法 概念 


本 章 是 介绍 书 中 将 要 用 到 的 算法 分 析 和 设计 的 框架 。 这 部 分 内 容 基 本 上 是 自 含 的 ， 同 时 
也 会 引用 到 将 在 后 面 介 绍 的 一 些 内 容 。 

首先 ， 我 们 要 讨论 几 个 一 般 的 计算 问题 及 用 到 的 算法 ， 并 以 排序 问题 作为 主要 的 例子 来 
叙述 。 为 了 描述 算法 ， 下 面 引 进 一 种 一 般 程序 人 员 都 应 该 部 悉 的 “ 伪 代码 *。 必 为 第 一 个 例子 
我 们 将 考察 插 人 排 订 ， 分 析 它 的 执行 时 间 ， 并 引进 一 种 能 反映 出 被 排序 项 目 数 与 运行 时 间 关 
系 的 表示 法 。 然 后 ， 还 要 介绍 算法 设计 中 的 分 治 方法 ， 并 用 它 来 设计 合并 排序 算法 。 最 后 ， 
对 两 种 排序 算法 进行 了 比较 . 


t.1 算 法 


算法 的 形式 定 尺 可 以 看 作 是 任意 一 个 良 定 义 的 计算 过 程 ， 它 以 一 个 或 一 些 值 作为 输 人 ， 
并 产生 出 一 个 或 一 组 值 作 为 箱 出 。 因 而 ， 一 个 算法 也 就 是 一 系列 的 将 输入 转换 为 输出 的 计算 
步骤 。 

一 个 算法 还 可 以 被 看 作 是 用 来 解决 一 个 良 定义 计算 问题 的 工具 。 对 问题 的 描述 是 用 一 般 
的 语言 来 规定 输入 和 输出 之 交 的 关系 ， 而 对 应 的 算法 则 给 出 一 个 可 以 获得 该 输入 输出 关系 的 
计算 过 程 。 
为 了 开始 研究 算法 ， 我 们 来 看 这 样 一 个 问题 : 将 一 系列 数 排序 成 非 降序 。 这 个 问题 在 实 
践 中 很 常见 ， 从 中 可 以 看 出 许多 标准 的 算法 设计 技术 和 分 析 工 具 是 如 何 应 用 的 。 下 面 是 对 排 
序 问 题 的 定义 : 

输入 :; 一 列 数 <al，aa，…，au> 


输 册 : 对 输入 数 序列 的 一 个 变换 ( 重 排序 )<a ，a,，…，a > 


/其 al <ai<…<sa，  ， 

对 一 个 具体 的 输入 数 序列 <4154,69,36,51.68> ， 由 排序 算法 返回 的 结果 序列 为 
<36,41,51,51.68,69> 。 这 样 的 一 个 输 人 序列 被 称 为 是 该 排序 问题 的 一 个 实例 。 一 般 地 ， 一 
个 隔 题 的 实例 是 由 满足 问题 陈述 中 所 给 出 的 限制 、 为 计算 出 该 向 题 的 一 个 结果 的 所 有 输 人 构 
有 不 的 。 

在 计算 机 科学 中 ， 排 序 是 一 个 很 基本 的 操作 (许多 程序 把 它 作为 一 个 中 间 步 又 )， 因 而 人 
们 设计 出 了 大 量 的 排序 算法 。 对 于 一 个 具体 应 用 选择 骂 一 个 算法 最 合适 , 要 取决 于 符 排 岸 的 
元 素 个 数 及 其 已 被 排序 的 程度 、 所 使 用 的 存储 设备 ( 主 存 ， 磁 盘 或 磁带 }， 等 等 。 

若 对 每 一 个 输 人 人 实例， 一 个 算法 都 能 停止 并 给 出 正确 的 答案 ， 册 说 这 个 算法 是 正确 的 ， 
并 且 ， 我 们 说 一 个 正确 的 算法 解决 了 给 定 的 计算 问题 。 一 个 不 正确 的 算法 对 某 些 输入 实例 可 
能 不 会 停止 ， 或 者 停止 了 但 给 出 的 不 是 所 需 的 答案 。 与 一 般 人 认为 的 相反 ， 不 正确 的 算法 在 


其 错误 率 可 以 被 控制 的 情况 下 可 能 是 很 有 用 的 。 这 一 局 我 们 将 在 第 三 二 三 章 讨论 弛 找 太 的 质 
数 的 算法 时 看 到 。 但 一 般 来 说 我 们 还 是 考 上 正 确 的 算法 。. 

一 个 算法 可 以 用 自然 语言 或 一 段 计算 机 程序 或 一 种 硬件 设计 来 说 明 ， 唯 一 的 一 个 要 求 就 
是 该 种 说 明 必 须 给 出 一 个 对 计算 过 程 的 精确 描述 。 

在 本 书 中 ， 我 们 将 以 伪 代 码 写 成 的 程序 来 表示 算法 ， 此 处 伪 代 码 与 和 C，Pascal 或 Algol 
很 接近 。 如 果 读 者 熟悉 这 几 种 语言 中 的 任何 一 种 ， 则 在 读 算 法 时 不 应 该 有 任何 问题 。 乙 代 欧 
与 真 代码 的 区 别 在 于 ， 前 者 可 以 引用 任何 县 有 表达 力 的 方法 来 最 清晰 、 最 简洁 地 表达 算法 . 
此 外 , 久 代 码 示 大 考虑 软件 工程 中 的 一 些 问题 ， 例 如 ， 为 了 更 简明 地 表达 某 个 算法 的 实质 ， 
在 依 代 码 中 常常 惫 略 数据 抽象 、 模 块 性 、 出 错 处 理 等 问题 。 


播 入 排序 . 


我 们 首先 看 一 看 插 人 排序 。 这 种 算法 对 少量 元 素 的 排序 较为 有 效 。 插 人 排序 与 人 们 在 打 
牌 时 整理 手 上 的 牌 的 方式 有 点 相似 。 在 开始 打牌 时 ， 我 们 的 左手 是 空 的 ， 所 有 的 牌 都 面 朝 下 
放 在 桌 上 。 然 后 , 一 次 一 张 地 从 桌 上 拿 牌 并 搬 人 左手 中 正确 的 位 置 。 为 了 找到 这 个 正确 位 
置 ， 自 左 向 右 地 将 这 张 牌 与 手中 已 有 的 每 一 张 牌 比较 。 

插 人 排序 的 伪 代 码 用 过 程 HWSERTION-SORT 来 表示 ， 其 参数 为 包含 m 个 待 排序 数 的 
数组 A[1.n]。( 在 下 面 的 代 码 段 中 ，A 中 元 素 个 数 n 用 length[Al 表 示 。) 葵 入 数据 在 A 中 进 
行 重 排 ,任何 时 候 只 有 国定 数目 的 几 个 元 素 要 和 暂 存 在 数组 之 外 。 当 过 程 INSERTION-SORT 
结束 时 ， 数 组 A 中 就 是 已 排 好 序 的 输出 数 序列 。 


JTNSERTION--SORTLA) 

1 fotj < 一 2to3emetb[A] 

2 dokey+ 太 有 

3 信 将 A[] 播 人 到 排 好 序 的 序列 A[1. 证 中 
二 ie 一 二 | 

5 While i>0and A 国 > key 
6 .po 本 [i 寺 1 一 本国 
7 i 和 1 

多 上 1 十] key 


图 1.1 播 人 排序 算法 的 工作 过 程 


图 1.1 显 东 了 在 A= < 5.2,4.6,1,3,> 时 算法 的 工作 过 程 。 下 标 j 指示 被 捅 到 手中 去 的 “ 当 
前 牌 "。 下 标 j 的 和 位置 用 一 个 圆圈 指示 。 数 组 元 素 A[1.. 训 构成 了 手中 已 排 好 序 的 牌 ， 
上 [ 计 1.. 吕 对 应 于 在 桌 上 的 牌 。 不 标 j 自 左 向 右 地 在 数组 中 称 动 。 在 每 一 轮 外 循环 (for 语句 ) 
中 ，A 属 击 数 组 中 被 挑 出 (第 2 行 )。 然 后 ， 从 位 置 六 1 开始 ， 每 个 元 素 都 相继 地 向 右 移 动 一 
格 ， 直 至 找到 Ab] 的 正确 位 置 (第 4-?7 行 )， 再 将 其 插 人 。 


伪 代 码 的 使 用 约定 


在 伪 代 码 的 使 用 中 有 以 下 一 些 约定 : 

1. 书 写 上 的 “ 缩 进 " 表 示 程 序 中 的 分 程序 结构 。 例 如 ， 从 第 1 行 开始 的 for 循环 的 悼 包括 
第 2-8 行 ， 从 第 5 行 开 始 的 while 循环 的 体 包括 第 6-7 行 。 这 种 缩 进 风格 也 适用 于 
认 -then~else 语句 。 用 缩 进取 代 传 统 的 begin 和 end 语句 来 表示 程序 的 块 结构 ， 可 大 大 提高 
代 玛 的 清晰 性 . 

2.while,forrepeat 等 循环 结构 和 ithenelse 条件 结构 与 Pascal 中 相同 。 

3. 符 号 “ 心 "表示 后 面部 分 是 个 注释 。 

4. 狗 重 左 值 i-i*e 是 将 表达 式 e 的 值 赋 给 变量 1 和 小 这 种 表示 与 j<-e 和 ij 等 价 。 
5. 变 量 ( 如 刘 ; 和 key) 局 部 于 特定 过 程 。 不 能 不 加 显 式 说 明 就 使 用 全 局 变量 。 
.数组 元 素 的 取 接 由 数组 名 后 跟 4 下 标 ]" 表 示 。 例 如 ，A[] 指 示 数 组 A 的 第 j 个 元 素 。 符 

号 *..” 用 来 指示 数组 中 值 的 范围 , 鲍 如 ，A[1..jj 表 示 包 例 元 素 Ai， 和 [人 ，…， 和 的 子 数 
组 。 

7. 复 合 数据 用 对 象 (objecb 来 表示 ， 对 稼 由 属性 (attributej 和 域 (field) 梅 成 。 城 的 取 接 是 由 
域名 后 接 由 方 括 叶 括 住 的 对 象 名 表示 。 例 如 ， 数 组 可 以 被 看 作 是 一 个 对 象 ， 其 属性 有 
length， 和 表示 其 中 的 元 素 个 数 ， 如 length[A] 就 表示 数组 A 中 的 元 素 个 数 。 在 表示 数组 元 素 
”和 对 象 属性 时 都 机 用 到 方 括号 ， 一 般 来 说 从 上 下 文 就 可 以 看 出 其 含义 。 

用 于 表示 一 个 数组 或 对 得 的 变量 被 看 作 是 托 向 表示 数组 或 对 象 的 数据 的 一 个 指针 。 对 于 
某 个 对 象 x 的 所 有 域 f， 屿 但 Y*-x 就 使 得 人 ]= 和 fj]。 更 进一步 ， 者 有 fxl< 3， 则 不 仅 有 
和 =3， 周 时 作 ]=3。 换 言 之 ， 在 冉 值 y<-x 后 ，x 和 y 指向 同一 个 对 象 。 

有 了 时 ， 一 个 指针 不 措 向 任何 对 象 。 这 时 ， 我 们 研 给 它 NIL， 

8. 参 数 用 按 值 传 递 方式 传 给 一 个 过 程 : 被 调 过 程 接 收 参 数 的 一 份 副 本 , 若 它 对 某 个 参数 
典 值 ， 则 这 种 变化 对 调用 过 程 是 不 可 见 的 。 当 传递 一 个 对 象 时 ， 只 是 捞 员 指 癌 该 对 象 的 指 
针 ， 而 不 拷贝 其 各 个 域 。 例 如 ， 设 广 是 一 个 被 调 过 程 中 的 参数 ， 出 赋值 x<-y 对 调用 过 程 是 

不 可 见 的 ， 但 赋值 ffxj<-3 是 可 咒 的 。 


1.2 算法 分 析 


算法 分 析 即 指 对 一 个 算法 所 需 的 资源 进行 预测 。 一 般 来 说 ， 资 源 是 指 计算 时 间 ， 有 时 也 
指 存 鱼 器 、 通 信 带 宽 或 逻辑 门 等 。 给 定 一 个 问题 后 ， 通 过 分 析 玫 个 候选 算法 ， 可 以 从 中 选 出 
一 个 最 有 效 的 算法 。 

在 分 析 一 个 算法 前 ， 要 建立 有 关 实 现 技术 的 模型 ， 包括 描述 所 用 资源 及 代价 的 模型. 本 
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书 主要 采用 一 种 单 处 理 器 一 一 随机 存 取 器 (RAMD 来 作为 计算 模型 ， 算 法 即 可 用 计算 机 程序 
来 表达 。 在 RAM 模型 中 ， 指 令 一 条 接 一 条 地 执行， 没有 并 发 操作 。 在 后 面 几 章 中 ， 我 们 
”将 讨论 有 关 并 行 计 算 机 的 模型 。 

算法 分 析 有 一定 的 困难 ， 即 便 是 分 析 一 个 很 简单 的 敌 法 也 是 这 样 所 用 到 的 数学 工具 包 
括 离 散 数 学 、 组 合 论 、 初 等 概率 论 等 等 ， 一 个 算法 在 不 同 输 人 时 其 行为 可 能 不 一 样 ， 因 而 我 
们 需要 用 一 些 简单 、 易 懂 的 会 式 来 扣 结 其 行为 。 

虽然 我 们 仅 选 一 种 机 器 模型 来 分 析 算 法 ， 在 表达 所 做 的 分 析 时 还 会 面 痢 不 少 选择 。 我 们 
的 目标 之 一 是 所 选 表示 方式 要 易于 书写 、 操 纵 ， 要 能 显示 出 算法 的 资源 要 求 的 特性 ， 同 时 如 
免 不 几 要 的 细节 。 


插入 排序 算法 的 分 析 


INSERTION-SORT 过 程 的 时 间 开销 与 输入 有 关 : 排序 1000 个 数 的 时 间 比 排序 三 个 
数 的 时 间 要 长 。 还 有 ， 即 使 排序 两 个 相同 长 度 的 输入 序列 的 时 间 也 可 能 不 同 ， 这 取决 于 它们 
已 排序 的 程度 。 一 般 地 ， 算 法 所 需 时 间 是 与 输 和 人 规模 同步 增长 的 , .因而 常 常 将 一 个 程序 的 运 
行 时 间 表 示 为 其 输入 的 函数 。 这 就 要 求 对 术语 “运行 时 间 " 和 “输入 规模 "更 仔细 地 加 以 定义 。 

输 和 人 规模 的 概念 与 具体 问题 有 关 。 对 许多 问题 来 说 (如 排序 或 计算 离散 傅 里 时 变换 )， 最 
自然 的 量度 标准 是 输入 中 的 元 素 个 数 : 例如 ， 符 排序 的 数组 大 小 n。 对 另 一 些 问题 (例如 两 个 
整数 相 乘 )， 其 输入 规模 的 最 佳 量度 是 输入 数 在 二 进 制 表示 下 的 位 数 。 有 时 ， 用 二 个 数 (而 非 
一 个 ) 来 表示 输入 斌 能 更 合适 。 例 如 、 某 一 算法 的 输 和 人 是 个 图 ， 则 输入 规模 可 由 图 中 顶点 数 
和 边 数 来 表示 。 在 下 面 讨论 的 每 一 个 问题 中 , 我 们 都 将 指明 所 用 的 量度 标准 。. 

一 个 算法 的 运行 时 间 是 指 在 特定 输入 时 所 执行 的 基本 操作 数 (或 步 数 })。 可 以 很 方便 地 定 
义 独 立 于 其 体 机 器 的 “步骤 ?概念 。 骨 前 我 们 先 采 用 以 下 观点 , 每 执行 一 行 伪 代 码 都 要 花 一 定 
量 的 时 间 。 虽 然 每 一 行 所 花 的 时 间 可 能 不 同 ， 我 们 假定 每 爽 执行 第 i 行 所 花 的 时 间 都 是 常量 
ci。 这 种 观点 与 RAM 模型 是 一 致 的 ， 同 时 也 反 喘 出 了 伪 代 码 在 真实 计算 机 上 是 如 何 实现 
的 . 

在 下 面 的 讨论 中 ， 我 们 由 繁 到 简 地 给 出 INSERTION-SORT 运行 时 间 的 表达 式 。 简 单 
的 表达 式 使 得 我 们 更 容易 从 众多 的 算法 中 选择 最 为 有 效 的 一 个 。 

我 们 先 给 出 INSERTION-SORT 过 程 中 每 一 条 指令 的 执行 时 间 及 执行 的 次 数 。 对 
j=2.3…,n0，n=1lengthfA]， 设 6 为 第 5 行 中 while 循环 所 做 的 测 斌 次数。 另外， 还 假定 注解 
部 分 是 不 可 执行 的 ， 因 商 不 占 运 行 时 间 。 


INSERTION 一 SORTLA) 人 号 工 TIMES 
T forj=-2tolengtdjA| Ci 
2 dokeye 一 wkA[jj Ca nm 一 1 
3 从 将 A 中 请 入 排 好 序 的 序列 A[1i 一 HU 0 一] 
二 is- 入 1 Cs 1 一 上 
$ while i>0Oand 太 [> key c 2 一 27 
， ， 。 。 - 避 好 一行 
6 do AA[i 上 +1]<- 入 站 C6 让 一 2 ， 
7 ii 广 1 吕 工 = 
名 


AT key cs n 一 1 


该 算法 总 的 运行 时 间 是 每 一 个 语句 执行 时 间 之 和 ， 若 执行 一 条 语句 要 c 步 ， 又 共 执 行 
了 ana 次 这 条 语句 ， 则 它 在 总 运行 时 间 中 占 cn。 为 计算 总 运行 时 间 T[n]， 对 每 一 对 cost 与 
times 之 积 求 和 ， 得 : _ 
TU 三 ca+c 一 贡 二 cta 一 1 十 cs 开 十 ce 王 他 一 匡 


十 c。 2 一 也 十 cs tn 一】 


即便 是 对 给 定 规模 的 输 人 人， 一 个 算法 的 运行 时 间 还 与 该 规模 下 哪 一 种 输入 有 关 。 例如 在 
INSERTIION-SORT 中 ， 当 输入 序列 已 排 好 序 时 出 现 最 佳 情况 。 对 于 j= 2.3,…m 中 的 每 一 


个 值 ， 在 第 5 行 中 有 A[ilkkey，i 的 初 值 是 访 1。 因 而 ti= 1，3，…，mn， 最 佳 运行 时 间 为 ; 
TU =cin+C ,一切 十 C， tn 一 已 十 c， 人 一 切 十 C， 全 一] 


一 (ce， 十 c, 十 c, 十 6 十 C 和 一 (c， 十 c. 十 cy 十 5 ) 
”这 个 式 子 还 可 表达 成 an+b， 其 中 常数 a 和 bb 依赖 于 c 即 该 式 是 n 的 一 个 线性 函数 。 
如 果 输 人 数组 正好 呈 完 全 反 序 ( 即 递 降 序 )， 则 出 现 最 坏 情 况 。 这 时 ， 要 将 每 个 A 昌 与 已 
排序 的 子 数组 A[1. 3 中 的 每 一 个 作 比 较 ， 就 有 6 一 jj= 2 3,… .了 。 注 意 到 
ij=-z+D - 1 条 26- - 呈 - na 一 1 
就 可 以 将 INSERTION-SORT 乓 和 


工 只 一 cn 十 ca 一 贡 十 ci 一切 十 c， (2 -了 


十 ci， ( 允 了 2) 十 (2 地 2 上 +cita 一 二 





一 人 十 cg 二 cy +c) 
此 式 也 可 写成 an?Hbn+c， 常量 as，b 和 ce 依赖 于 c， 即 这 是 m 的 一 个 二 次 函数 。 
景 怀 情况 各 平均 情况 分 析 


在 分 析 插入 排序 时 ， 我 们 讨论 了 局 佳 和 最 坏 情况 下 的 算法 性 态 。 在 本 书 的 后 面 章 节 中 ， 
我 们 主要 是 考察 最 坏 情况 下 的 运行 时 间 ， 即 在 规模 n 下 的 任何 输入 中 的 最 长 运行 时 间 。 做 
出 这 种 选择 的 原因 如 下 ， 
- 算法 的 最 坏 情 况 运行 时 间 是 在 任何 输入 下 的 运行 时 间 的 上 界 ， 这 就 保证 算法 的 运行 时 
间 不 会 比 它 更 长 。 
. 对 某 些 算法 来 说 ， 最 坏 情 况 是 经 常 发 生 的 。 例 如 ， 在 搜索 “个 数据 库 时 ， 若 待 搜索 的 
数据 项 不 在 其 中 。 则 搜索 算法 的 最 坏 情 况 就 会 发 生 ， 
. “平均 情况 * 的 时 间 性 态 常常 与 最 坏 情况 下 的 大 致 _ 样 ， 例 如 , 可 以 随机 取 n 个 数 进行 
插入 排序 。 要 找到 元 素 Ab] 在 子 数组 A[1.ji] 中 的 位 置 要 花 多 少时 间 ? 平 均 来 说 ，A[1.i 广 1] 中 
的 一 半 元 素 小 于 AD]， 而 另 一 半天 于 AI， 于 是 ，t =j/ 2。 据 此 算出 平均 情况 运行 时 间 ， 其 


表达 式 是 输入 规模 的 二 次 函数 ， 与 最 坏 情 况 下 一 致 。 

在 某 些 特殊 情况 下 ， 我 们 感 兴趣 的 是 一 个 算法 的 平均 情况 (或 期 望 的 ) 运 行 时 间 。 这 时 存 
在 的 一 个 问题 是 对 一 个 给 定 的 问题 ， 到 底 什么 样 的 输入 是 一 个 “平均 输入 "可 能 不 是 很 明显 。 
通常 ， 我 们 假定 一 个 特定 规模 下 的 所 有 输入 的 “平均 性 "都 是 一 样 的 。 在 实际 中 有 可 能 要 违反 
这 个 假定 ， 但 采用 随机 算法 就 可 以 强制 这 玉成 立 ， 


增长 的 量 级 


为 了 简化 对 INSERTION-SORT 过 程 的 分 析 ， 我 们 做 了 某 些 简化 抽象 。 首先 ， 我 们 忽 

略 了 每 条 语 铝 的 真实 代价 ， 而 用 常量 e 来 表示 。 其 次 ， 还 可 以 更 加 位 单 :最 坏 情况 运行 时 间 
是 an2+bn+te，a，b 和 c 是 依赖 于 c 的 常量 。 这 样 ， 我 们 就 不 仅 忽略 了 真实 代价 ， 也 忽略 了 
抽象 代价 a。 

” 现在 再 做 进一步 的 简化 抽象 ， 即 运行 时 间 的 增长 率 (rate of growtb)， 或 称 增长 量 级 (or 
der of growtt)。 这 样 ， 我 们 就 只 考 囊 公式 中 的 最 高 次 项 (例如 ，an5]， 因 为 当 很 大 时 低 阶 
项 相对 来 说 不 太 重 要 。 另 外 ， 还 忽略 最 高 次 项 的 常数 系数 ， 因 为 在 考虑 较 大 规模 输 和 人 下 的 计 
算 效 率 时 相对 于 增长 率 来 这 ， 系 数 是 次 要 的 。 例 如 ， 捅 人 排序 的 最 坏 情况 时 间 代价 的 阶 为 
@(n 习 。 本 章 中 我 们 先 非 正式 地 用 这 种 @@- 表 示 ， 在 第 二 章 中 要 给 出 它 的 准确 定义 . 

妈 果 一 个 算法 的 最 坏 情 况 运行 时 间 的 阶 要 比 另 外 一 个 算法 的 低 ， 我 们 就 常常 认为 它 更 为 
有 效 。 在 输入 的 规模 较 小 时 ， 这 种 看 法 有 时 可 能 不 对 ， 但 对 足够 大 规模 的 输 人 来 说 ， 一 个 具 
有 阶 昌 (o3 的 算法 在 最 坏 情况 下 比 阶 为 @(na9) 的 算法 运行 得 更 快 . 


13 算法 设计 


算法 设计 有 很 多 方法 。 擂 人 排序 使 用 的 是 增 量 (incrementab) 方 法 :在 排 好 子 数组 A[1.j 一 ]j 
后 ， 将 元 素 Ai 揪 人 ， 形 成 排 好 序 的 子 数 组 A[1.j]。 

在 本 节 中 ， 我 们 要 介绍 另 一 种 设计 策略 ， 叫 做“ 分 治 法 ” (divide_and_eonquen， 下面 要 
甫 分 治 法 来 设计 一 个 排序 算法 ， 使 其 性 能 比 搬 人 排序 好 得 多 .学 了 第 四 章 就 可 知道 , 分 治 算 
法 的 优点 之 一 是 可 以 利用 在 第 四 章 中 介绍 的 技术 很 容易 地 确定 其 运行 时 间 。 


1.3.1 “分 治 法 8 


有 很 多 算法 在 结构 上 是 递归 的 :为 了 解决 一 个 给 定 问题 ， 算法 要 一 次 或 多 次 地 递归 调用 
”其 自身 米 解决 相关 的 子 问题 。 这 些 算法 通常 采用 分 治 策略 :将 原 问 题 分 成 屏 个 规模 较 小 而 结 
构 与 原 问题 相似 的 子 问 题 ;递归 地 解 这 些 子 问题 ， 然 后 合并 其 结果 就 得 到 原 问题 的 解 。 

分 治 模式 在 每 一 层 递归 上 都 有 三 个 步 又 ， 

分 解 (Divide ) 将 原 问 题 分 解 成 一 系列 子 问 题 ; 

解决 (Conquerj: 递归 地 解 各 子 问题 。 若 子 问 题 足够 小 ， 则 直接 求解， 

合并 (Combine), 将 子 问题 的 结果 合并 成 原 问题 的 解 ; 

合并 排序 算法 完全 依照 了 上 述 模式 : 

分 解 : 将 mn 个 元 素 分 成 各 含 mv 2 个 元 素 的 子 序 列 

解决 , 用 合并 排序 法 对 两 个 子 序 列 递 归 地 排序 ; 


合并 , 合并 两 个 已 排序 的 子 序 列 以 得 到 排序 结果 。 和 

在 对 和 子 序列 排序 时 ， 当 其 长 度 度 为 1 时 递归 结束 。 单个 元 庇 被 视 为 是 已 排 好 序 的 ， 

合并 排序 的 关键 步骤 在 于 合并 步骤 中 的 合并 两 个 已 排序 子 序列 。 为 做 合并 ; 引入 一 个 辅 
助 过 程 MERGR(A，p，q，T， 其 中 A 是 个 数组 ，p，q 和 是 下 标 ， 满 足 p<<q<r。 该 过 

程 假设 子 数 组 Alp..,qj 和 A[q+1. 可 部 已 排 好 序 ， 并 将 它们 合并 成 一 个 已 排 好 序 的 子 数组 

AIP.. 虽 。 

我 们 把 写 出 这 个 算法 的 伪 代 码 的 工作 留 作 练 习 (练习 1.3- 习 ， 容 易 想 像 出 MERGE 过 程 
的 时 间 代 价 为 @(n)， 其 中 n= cp+1 是 待 排 序 的 元 素 个 数 ， 这 个 过 程 如 果 用 玩 扑 克 牌 来 比 
喻 ， 就 可 以 看 作 桌 上 有 两 堆 牌 ， 每 一 堆 都 是 排 好 序 的 ， 最 小 的 牌 在 最 上 面 ， 我 们 希望 把 这 两 
扒 牌 合并 成 排 好 序 的 一 堆 加 以 输出 。 基 本 步骤 包括 选取 面 朝 上 的 两 夫 牌 的 顶 上 两 张 中 较 小 的 
一 张 ， 将 它 取 出 面 朝 下 地 放 到 输出 堆 中 。 重 复 这 个 步 双 ;直到 某 一 输入 堆 为 空 。 这 时 把 另 一 
输 和 人 堆 中 余下 的 牌 面 朝 下 放 人 输出 堆 中 即 可 。 从 计算 的 角度 来 看 ， 每 一 个 基本 步 双 所 花 时 间 
是 个 常量 ， 因为 我 们 只 是 查看 并 比较 项 上 的 两 张 牌 义 因为 至 多 进行 o 次 比较 ， 所 以 合并 
排 庆 的 时 间 为 @(n); 

现在 就 可 以 把 MERGE 过 程 作 为 合并 排 岸 中 的 一 个 子 程序 来 用 了 。 王 面 的 过 程 
MERGE-SORIA，Pp，D 对 于 数组 Ap 进行 排序 。 若 Pr， 该 子 数 组 中 至 多 只 有 一 个 元 
素 ， 当 然 就 是 已 排序 的 。 和 否则， 分 解 步骤 就 计算 出 一 个 下 标 g, 欧 Aip..r] 分 成 A[p..q] 和 
AIq+1l..rl， 备 售 rnav21 和 1ny72 个 元 素 。 


MERGE-SDRTIA,P.OD 
1 这 PP<T 
2 thenq- 一 (pHO7 2 


3 MERGE-SORTIA,p,d) 
5 WE 必 司 ELA ,Pdqr) 
妾 厅 约 
[L 2 
ee ee w 
ee 合并 et 
Le 过 只 人 
[2 4 5 0] L 2 3 4| 
冤 
下 人 
蕊 -3 [4 6 [2 
可 移 形 千 灌 和 轩 开 和 力 


L 合并 六 
后 回国 本 


隔 1.2 合并 排 岸 的 过 程 


为 了 对 整个 序列 A = <A[1E ，Af[ 了 了, …-，A[mj> ， 要 闻 用 SORT(A。、1，length[AD， 其 
中 length[A]=mn。 如 果 我 们 自 底 向 上 (此 处 * 底 "为 当 是 ? 的 宕 时 ) 来 看 这 个 过 程 的 操作 时 ， 
算法 将 两 个 长 度 为 1 的 序列 合并 成 排 好 序 的 长 度 为 2 的 序列 ， 继 而 合并 成 长 度 为 4 的 序列 ， 
一 直 进 行 到 将 两 个 长 课 为 nmn72 的 序 刚 合 并 成 最 终 排 好 序 的 长 度 为 n 的 序列 。 图 1.2 说 明了 
对 数组 A= <$，2，4，6，1，3，2，6> 进 行 合并 排序 的 过 程 , 不 难 着 出 , 随 着 算法 自 底 向 
上 地 执行 ， 被 合并 的 排序 序列 的 长 度 乏 源 增 加 。 


1.3.2 分 治 算法 分 析 


当 一 个 算法 中 含有 对 其 上 自身 的 甫 归 调用 时 ， 其 运行 时 浊 可 用 一 个 递归 方程 (或 递归 式 } 来 
表述 ， 该 方程 通过 描述 于 问题 与 原 问 题 的 关系 来 给 弄 总 的 运行 时 间 。 我 们 下 以 利用 数学 工具 
来 解决 递归 式 并 给 出 算法 性 能 的 上 界 。 

分 治 算 法 中 的 递归 式 是 基于 基本 模式 中 的 三 个 步骤 的 。 设 TOn) 为 在 规模 下 问题 的 运 
行 时 间 。 如 果 于 足够 小 、 例 如 有 nssete 为 常 访 )， 则 得 到 它 的 直接 解 的 时 间 为 常量 ， 写 作 
G@(UJ。 假 设 我 们 把 原 问 题 分 成 a 个 子 问题 ， 竺 一 个 的 大 小 是 原 问题 的 17bP。 车 分 解 该 问题 
和 合并 解 的 时 间 各 为 DUm)， 则 得 递归 式 


TO ={20) 滋 日 鹤 c 
aaTab)+Dm +Com，、 否 岗 


在 第 四 章 中 ， 将 介绍 如 何 消除 这 类 递归 ， 
.合并 排序 算法 的 分 析 


MERGE-SORT 的 伪 代 码 在 元 素 为 柯 数 个 时 能 正确 地 工作 ， 而 此 处 我 们 为 了 简化 对 基 
于 递归 的 算法 的 分 析 ， 就 假定 诛 问 题 的 规模 是 2 的 霸 次 ， 这 祥 每 -次 分 甫 所 产生 的 子 序列 的 
-长度 恰 为 an/ 2。 在 第 四 章 中 ， 我 们 会 看 到 这 个 艇 设 不 影响 甫 归 式 解 的 阶 。 
以 下 给 出 递归 形式 的 Ta)， 其 最 趟 情况 于 人 台 并 排 译 mn 个 数 的 送行 时 间 。 合 并 排序 一 个 
元 素 的 时 间 是 个 常量 。 当 mn> LI 时， 将 运行 时 间 站 下 分 解 ， 
分解 :这 一 步 仅 仅 是 计算 出 子 数组 的 中 间 位 置 ， 项 要 常 最 时 间 ， 因 而 DO)= 90). 
解决 :递归 地 解 两 个 趣 模 为 ny 2 的 子 问题 ， 时 间 为 2FCn 7 2。 
合并 :已 知 MERGE 过 程 在 一 个 售 有 ua 个 元 素 的 子 数组 上 的 运行 时 间 为 @n)， 则 
Cn= etn). 
函数 也 (四 和 Ci) 前 阶 为 台 加 和 GD)， 它 们 的 和 是 的 线性 范 数 ， 即 阶 为 Bkm。 将 它 
与 “解决 "步骤 中 所 得 的 项 zTn 7 3) 相 加 ， 即 得 Ttn) 的 递 娄 表示 ， 
@() 如 果 n= 1 
TO 一 tr y 仿 +e) 如 果 n > 1 


在 第 加 章 中 ， 我 们 将 证 明 T(m 的 阶 是 昌 nn)， 此 处 色 na 代表 iogon。 当 输 人 规模 足够 
大 峙 ， 合 并 排序 (运行 时 间 为 @n 0) 要 比 最 坏 情 况 下 的 搬入 排序 (运行 时 间 为 @n 人 好 。 
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1.4 小 结 


为 解决 同一 个 问题 而 设计 的 各 种 算法 在 效率 上 会 有 很 大 差异 。 这 些 差异 可 能 比 个 人 微型 
”计算 机 与 巨型 计算 机 之 间 的 差异 还 要 天。 例如， 让 一 人 台 巨 型 机 做 播 信 排序， 让 另 一 合 微型 机 
” 微 合 并 排序 ， 它 们 的 输入 都 是 一 个 长 夭 为 100 万 的 数组 。 假 设 巨 型 机 每 秒 执行 1 亿 条 指令 ， 
微型 机 每 秒 仅 公敌 100 万 条 指令 。 为 了 使 差别 更 明显 ， 假 设 世界 上 最 优秀 的 程序 员 用 机 器 代 
码 在 巨型 机 上 实现 播 人 排序 ， 编 出 的 程序 需要 执行 2 条 巨型 机 指令 来 排序 n 个 数 。 另 一 方 
面 ， 让 一 个 一 般 的 程序 员 在 微型 机 上 用 高 级 语言 写 合并 排序 ， 产 生 的 代码 要 花 50n lga 条 微 “ 
型 机 指令 。 为 排序 100 万 个 数 ， 巨 型 机 需 费 时 间 ， 


晤 。、 宇 
2 10 ) 条 指令 = 20000 秒 sx 5.56 小 时 
10 条 指令 7 秒 


微型 机 移 费 时 间 ; 


在 
50- 10 810 条 指令 = 1000 秒 = 16.67 分 
10 条 指令 7/ 秒 


由 上 述 可 以 看 出 ， 由 于 采用 了 更 低 阶 的 算法 ， 即 使 是 用 低 效 的 编译 器 ， 微 型 机 还 是 要 比 
- 巨 融 机 快 20 倍 ! 

这 个 例子 说 明了 算法 设计 像 设计 计算 机 硬件 一 样 也 是 一 种 技术 。 整 个 系统 的 性 能 的 提高 
既 要 依赖 于 快速 的 硬件 ， 也 要 依赖 于 高 效 的 算法 。 目 前 ， 正 如 其 他 计算 机 技术 一 样 ， 算 法 的 
研究 也 在 不 断 地 取得 进展 。 


酒 
处 
党 


1-1 运行 时 间 的 比较 


对 于 下 表 中 的 每 个 表 数 Km 和 时 间 t， 设 解决 一 个 问题 的 算法 需要 fm) 微 秒 ， 请 确定 在 
时 间 t 内 所 能 解决 的 问题 的 最 大 规模 mn。 


1 天 
加 到 到 国 


In 
| 
和 国 生 
ngna 
上 
和 
2 
了 二 
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1-2 合并 排序 中 擂 入 排序 在 短 数 组 二 的 应 用 


虽然 合并 排序 的 最 坏 情 况 运行 时 间 为 母 nlg mm， 揪 人 排序 的 为 Bo 轨 ， 但 在 m 较 小 时 ， 
后 者 更 快 。 因 而 ， 在 合并 排序 中 ， 当 子 问题 已 足够 小 时 ， 可 以 应 用 插 人 排序 .考虑 对 合并 排 
序 做 一 个 修改 :nyK 个 长 度 为 k 子 表 用 揪 和 人 排序 来 排 ， 然 后 应 用 标准 的 合并 机 制 . 上 值 符 
定 。 

a. 证 明 在 最 坏 情 况 下 ，nyk 个 子 表 (每 个 长 度 为 好 用 插 人 排序 来 排 的 时 间 为 @nk)。 

b. 证 明 在 最 坏 情 况 下 各 子 表 可 以 在 Balg (ny 匡 ) 内 合并 。 

c. 设 修改 后 的 合并 算法 的 时 间 阶 为 @Bnk+tn lg tn Jo)。 请 给 出 最 大 的 源 近 值 k( 以 人 @ 一 
证 号 表示 , k 是 mn 的 函数 )， 使 得 修改 后 的 算法 有 和 标准 合并 算法 一 样 的 渐 近 运行 时 间 。 

d.k 值 在 实际 中 如 何 年? 


1--3 ”六 序 对 


设 Af1.n] 中 元 素 各 不 相同 。 若 i<j 且 A 四 > A 肿 ， 则 6，j 对 称 为 A 的 一 个 道 序 对 ， 

a. 列 出 数组 < 2,3,8,6,1 > 的 五 个 逆序 对 。 

b、 从 集合 {12,…, 对 中 选 出 一 些 元 素来 构成 数组 ， 则 什么 样 的 数组 中 的 六 序 对 最 多 ?共有 
多 少 ? 

c. 对 插 人 排序 来 说 ， 其 运行 时 间 与 输入 数组 中 的 逆序 对 数 的 关系 如 何 ?证 明 所 得 出 的 结 
论 。 

d 设计 这 样 一 个 算法 ， 使 之 能 够 在 9 lg o) 的 最 坏 情 况 时 间 内 确定 n 个 元 素 的 任意 一 个 
排列 中 的 赣 序 对 数 。 


练 习 一 


一 


1.1-1 以 图 1.1 作为 一 个 模型 ， 说 明 INSERTION-SORT 作用 于 数组 A = <31, 41, 59, 26, 41, 58 > 
上 的 过 程 。 

1.1-2 改写 INSERTION-SORT 过 程 ， 使 排序 的 输出 序列 呈 降 序 。 

1.1-3 考虑 下 面 的 查找 问题 : 

给 和 人: 一 列 数 上 = <aiaa> 和 一 仿 值 Y 

输出 : 下 标 i 使 得 v= A 自 ， 或 当 v 不 在 A 中 出 现时 为 NIL 

写 出 镍 对 这 个 问题 的 线性 查找 的 以 代 硒 . 

1.1-4 有 两 个 各 存 效 在 数组 A 和 卫 中 的 ma 位 二 进 整 数 ， 考 虑 它们 的 相 加 问题 ， 两 个 整数 的 和 以 二 进 
形式 放 在 具有 (n+l) 个 元 素 的 数组 C 中 。 请 给 出 这 个 问题 的 形式 化 描述 并 写 出 伪 代 码 。 


| 1.2-1 考虑 对 数组 A 中 的 个 数 的 排序 ,开始 时 先 找 出 A 中 的 最 小 元 素 并 放 在 另 一 个 数组 B 的 第 一 个 

位 置 上 。 然 后 找 出 A 中 次 最 小 元 素 并 放 在 B 的 第 二 个 位 置 上 ， 对 A 中 余下 来 的 元 素 继续 这 个 过 程 。 这 个 算 
法 称 为 选择 排序 ， 请 写 出 其 伪 代 码 ， 并 以 @@-- 形 式 写 出 其 量 佳 和 最 坏 情 况 下 时 间 代 价 。 

1.2-2 考虑 线性 查找 。 假 设 要 查找 的 元 素 可 能 落 在 数组 中 ， 则 平均 要 查找 多 少 个 元 素 ?最 坏 情况 下 呢 ? 

以 母 一 堪 式 表示 又 拭 样 ? 

1.2-3 考虑 一 个 任意 序列 <zx， 入 ，…，x 和 > 中 是 到 存在 重复 元 素 的 问题 .请 证 明 这 可 以 在 @n ] 攻 贡 


时 间 内 完成 . 、 
12-4 者 虚 在 某 个 点 上 对 一 个 多 项 式 求 信 的 问题 。 给 定 卫 个 系数 aoa… au 1 和 实数 x， 要 求 ， 
工 。 ex 请 给 出 解 快 这 个 问题 的 具有 @fn ) 时 间 代价 的 算法 。 另 请 给 出 一 个 使 用 以 下 Hormer 方案 的 具 
记 『@ 人 ) 的 竺 法. 
下 a 了 一 人 (axX 十 a :和 x 十 … 十 ai 和 冯 十 an 
12-5 用 名 -形式 表示 画 数 吕 7/ 1000-100n32_100n+3。 
1.2 一 6 9 华人 司 具有 好 的 最 佳 情况 运行 时 间 ? 


1.3-1 “以 图 1.2 为 模型 ， 说 明 合并 排序 在 输 和 人 数组 A= <3.41.52， 26,38,57,9,49> 上 的 执行 过 程 。 

1.3-2 请 写 出 MERGE(A。p，q， 了 的 伪 代 码 . 

1.3-3 播 人 排序 可 以 如 下 改写 成 一 个 递归 过 程 。 为 排序 AIl..n]， 先 递归 排序 AT[1. 1 的 后 将 AIn] 
插入 已 排 好 序 的 Af1..n- 世 。 写 出 表示 该 递归 过 程 运行 时 间 的 递归 式 ， 

1.3-4 ”回顾 练习 1.1-3 中 的 查找 问题 ， 注 意 到 如 果 A 是 已 排序 的 ， 则 我 们 可 以 把 y 与 中 点 进行 比较 . 
从 而 可 以 不 必 对 输 人 数 中 的 一 半 作 送 一 步 的 考 碟 . 了 便 草 下 去 就 构成 了 二 分 查找 ， 写 出 其 仿 伐 码 ， 并 请 证 明 
其 最 坏 情 况 运行 时 间 为 妃 ( lg 中 。 

1.3-5 在 1.1 节 的 INSERTION-SORT 中 ， 第 57 行 的 while 循环 中 使 用 了 线性 查找 法 来 搜索 已 排 
序 的 子 数组 A[1.. 语 。 能 否 通 过 使 用 二 分 查找 将 该 算法 的 最 坏 情况 运行 时 间 改 善 至 四 (mt 

1.3-65 * 请 给 出 一 个 运行 时 间 为 (algp) 的 算法 , 使 之 能 在 给 定 一 个 由 个 实数 构成 的 集合 S 和 另 一 
个 实数 xx 时 ， 关 断 出 $ 中 是 理 存 在 有 两 个 和 等 于 x 的 元 素 。 


1.4~1 假设 我 们 在 同一 台 机 器 上 来 比较 插 人 排序 与 合并 排序 的 实现 若 输 和 规模 为 n， 前 者 要 做 8n? 
缆 ， 后 者 要 做 64n 18n 步 。 对 哪些 n 值 来 说 插 人 排序 优 计 合并 排序 "在 输入 的 规模 较 小 时 、 如 何 重 写 合并 排 
序 的 人 芒 代 玛 使 之 运行 得 更 快 ? 

1.4-2 设 有 两 个 在 同一 全 机 器 上 实现 的 算法 ， 运 行 时 间 分 别 为 100m 和 22。 要 使 前 者 快 于 后 者 ， 最 小 
可 能 的 n 值 是 多 少 ? 


一 人 2 一 


第 二 章 函数 的 增长 


第 一 章 中 定义 的 算法 运行 时 间 的 阶 较 简明 地 刻画 了 一 个 算法 的 效率 ， 并 提出 了 对 不 同 的 
算法 进行 比较 的 手段 。 例 如 , 当 输 入 的 规模 nm 足够 大 时 ， 具 有 最 坏 情 况 运 行 时 间 @n jg im) 的 
合并 排序 庄 优 于 运行 时 间 为 @(o) 的 插 人 人 排序。 虽然 我 们 有 时 能 够 很 精确 地 算出 算法 的 运行 
时 间 ， 但 没 必要 花 那 么 大 的 力气 去 算出 额外 的 精确 度 。 对 足够 大 的 输入 来 说 ， 精 确 表示 的 运 
行 时 间 中 的 常 系数 和 低 阶 项 是 由 输 人 规模 决定 的 , 

当 输 入 规模 大 到 使 具有 运行 时 间 的 增长 量 级 有 关 时 ， 我 们 就 是 在 研究 算法 的 渐 近 效率 
了 。 亦 即 ， 我 们 只 关心 从 极限 的 角度 来 看 ， 运 行 时 间 是 如 何 随 着 输入 规模 的 无 限 增长 而 增长 
的 。 通 蓄 ， 从 渐 近 意义 上 说 更 有 效 的 算法 对 较 大 规模 的 输入 来 说 是 乒 佳 的 。 

本 章 将 介绍 几 种 标准 方法 来 简化 对 算法 的 渐 近 分 析 . 下 一 节 介 绍 几 种 渐 近 记号 ， 其 中 的 
加 一 记号 我 们 已 经 见 过 了 。 


2.1 渐 近 记号 


用 来 表示 算法 的 渐 近 运行 时 间 的 记号 是 用 城 为 自然 数 集 N= {0,.1.2,…} 的 函数 来 定义 
的 。 这 些 记号 可 以 很 方便 地 表示 最 坏 情 况 运行 时 间 TCD)， 因 为 T(n) 一 般 仅 定义 于 整数 输入 
:规模 上 。 有 时 将 这 些 记号 的 使 用 范围 变化 一 下 也 是 很 有 益 的 。 例 如 ， 这 些 记号 的 应 用 领域 可 
以 很 容易 地 扩充 至 实数 域 或 缩小 到 一 个 受 限 的 自然 数 集 上 。 但 要 注意 搞 清 楚 这 些 表 示 法 的 准 
确 含义 ， 方 能 做 到 “活用 "而 不 误 用 。 本 节 介绍 几 种 基本 的 渐 近 记号 和 一 些 常 见 的 扩充 用 法 。 


母 一 记号 


在 第 一 章 中 ， 我 们 知道 插入 排序 的 运行 时 间 为 T(m= 包 0n)。 现 对 这 种 表示 的 会 文 加 以 
定义 。 对 一 个 给 定 的 是 数 gm， 用 B(g(o) 来 指示 画 数 集合 : 

GStn) 一 fn) 存在 正常 数 ci ,cx 和 mn， 使 对 所 有 的 nno， 有 

0<cigtn)<cfitm<ccg(ojj 

对 任 _ 个 函数 fy， 若 存在 正常 数 chuca， 使 当 a 充分 大 时 ，fn) 能 被 夹 在 clg(m 和 cgtn) 
之 名 ， 则 ft) 属于 集合 @(g(o)。 虽 然 @(g(o) 是 个 集合 ， 我 们 仍 写 fa)= @(g(n)) 来 表示 ftn) 
是 GEtn)) 的 元 素 ， 这 种 等 式 的 活用” 初 看 起 来 有 点 令 人 迷惑 ， 但 在 下 面 就 能 看 到 它 具 有 一 
些 优越 性 。 

图 2.1 给 出 了 郴 数 fm 和 ea) 的 直观 图 示 ， 其 中 fm=@(gm)。 对 所 有 位 于 m 右边 的 了 
值 ，ftm 值 藩 在 clg(n 和 czg(n) 之 间 。 换 理 之 ， 对 所 有 nzno，fra) 在 一 个 常 因子 内 与 gm) 相 
等 。 我 们 说 go 是 fa 的 一 个 朵 近 确 错 。 

在 图 2.1 每 一 个 图 里 ，mo 是 最 小 可 能 的 值 。 (a) @-- 记 号 将 一 个 函数 限于 常数 因子 内 。 
我 们 写 fn) =G@(gn))， 如 果 存 在 正常 数 no，cl 和 c, 使 得 在 m 右边 ，ftn) 之 值 闪 是 落 在 

一 13 一 


cgCn) 与 cg(n) 之 间 。(b) DO- 记 号 抬 出 了 一 个 函数 的 上 界 。 我 们 写 Rn) =O(sCn))， 如 果 
存在 正常 数 ne 和 e 使 得 在 m 右边 ，fn) 的 值 总 落 在 cg(n) 之 下 。 (ec) 史记 号 给 出 了 一 个 
琐 数 在 一 个 常数 因子 内 的 下 界 。 我 们 写 fon) -Qtego))， 如 果 存 在 正常 数 no 和 ce 使 得 在 no 
右边 ，fn)j 的 值 总 在 cgtn)j 之 上 。 





中 和 下 二 
Fas Gy) (= (XEON . 0 = 
(3 ， tb) fc 
隔 2.1 驴 、O 和 9 等 记号 的 图 合 - 


(gm 的 定义 要 求 其 每 个 元 素 渐 近 非 负 ， 即 当 nm 充分 大 时 fp) 非 负 。 这 就 要 求 表 数 
gm 本 身 是 渐 近 非 负 的 ， 否 则 ， 集 合 @(g(o)) 就 是 空 的。 因此， 我们 假定 @ 一 记号 中 用 到 的 每 
个 函数 都 是 渐 近 非 负 的 。 这 个 假设 对 本 章 中 定义 的 其 他 渐 近 记号 也 成 立 。 

在 第 一 章 中 ， 我 们 引进 了 非 形式 的 @-~ 记 号 ， 其 效果 相当 于 会 弃 了 低 阶 项 和 最 高 阶 项 的 


系数 。 为 了 说 明 这 一 点 。 下 面 我 们 利用 形式 定义 来 证 明 5n?-3n= @Co?。 首 先 要 确定 常数 
cucz 和 no， 使 得 对 所 有 的 nz>no， 有 : 
cn nz-3n<coanz 
用 半 除 不 等 式 得 
o<5 -<o 
右边 的 不 等 式 在 n>1， coP17Z2Z 时 成 立 。 同样 ， 左 边 的 不 等 式 在 nb>>7，cs17 14 时 
成 立 。 这 样 ， 通 过 选择 o =17 14， c 一 172 及 po=?， 就 能 证 明 3m “一 3n<Bn )。 当 然 ， 还 


存在 常数 的 其 他 一 些 选 择 。 这 些 常数 依赖 于 函数 3nye(a 中 的 每 一 个 不 同 的 函数 就 会 有 不 


同 的 常数 . 

我 们 还 可 以 利用 形式 定义 来 证 明 6n? 夫 Ga])。 为 引出 矛盾 ， 设 存在 常数 c 和 no， 使 对 
所 有 的 nDZ>no 有 6nicecan2 这 样 就 有 n<esy 6， 这 在 na 为 任意 大 时 不 成 立 ， 因 为 cz 是 个 常 
数 。 

从 直觉 上 看 ， 一 个 渐 近 正 函数 中 的 低 阶 项 在 决定 渐 近 确 界 时 可 被 略 去 ， 因 为 当 n 很 大 
时 ， 它 们 就 相对 地 不 重要 了 。 最 高 阶 项 很 小 的 一 部 分 就 足以 支配 所 有 的 低 阶 项 。 因 而 ， 若 将 
ci 置 成 略 小 于 最 高 阶 项 系数 的 值 ， 而 将 c 置 成 略 大 于 上 的 值 ， 矶 可 满 是 鲜 - 记 号 定义 式 中 


的 不 等 式 。 同 样 ， 最 高 阶 项 的 系数 也 评 忽 略 ， 因 为 它 只 是 将 cl 和 c 改变 了 (等 于 该 系数 的 ) 
常 因子 倍 。 

例如 ， 考 塌 二 次 方程 fnj= an*+Hbn+tce， 其 中 a，b 各 为 常数 ， 且 a>0。 合 掉 低 阶 项 并 
奶 略 常数 项 就 得 fm= Gon5。 为 形式 地 说 明 病 样 的 结果 ， 杰 选 上 =av4， wm=7a/v4 及 
no=2 .maxf(blalvlclza)。 读者 可 以 证 明 ， 对 所 有 的 nm，Dcscttcsan 二 bnHec 
cm。 一般 地 ， 对 任何 一 个 多 项 式 pm 和 =ZE' van， 其 中 慎 是 常数 ，ai>0 ， 有 
Bf 一 电 On9( 现 思考 题 2 一 1)。 

因为 任意 一 个 常数 都 是 0 阶 的 多 项 式 ， 克 可 以 把 任何 常 函数 表达 成 @@n) 或 B(D)。 后 一 
种 表示 略 有 点 * 活 用" 了， 因为 从 中 看 不 出 来 是 哪 -个 变量 赵 于 无 穷 。 下 面 我 们 将 经 常用 记号 
昌 (D 来 表示 一 个 常数 或 带 函 数 ， 

@-- 记 号 

外 -记号 渐 近 地 给 出 了 一 个 函数 的 上 下 界 。 当 仅 有 渐 近 上 界 时 ， 用 O- 记 导 。 对 一 个 函 
数 gtn)， 用 Oo) 表示 天 数 集合 : 

O(gtnh)= fn 存在 正常 数 c 和 no， 人 使 对 所 有 的 nz>no 0< fn)<scgn} 

O-- 记 号 在 一 个 常数 因子 内 给 出 了 某 函 数 的 一 个 上 界 。 图 2.1(b) 说 明了 O- 记 号 的 直观 意 
义 。 对 所 有 位 了 ns 右边 的 值 ， 函 数 fm) 的 值 在 g(o) 之 下 。 

为 表示 一 个 函数 fn) 是 OUg(n)) 的 一 个 成 员 ， 写 fn)= De(n)。 注 间 fn)= Geg(m) 隐 全 
着 fo)= O(g(n))， 因 为 @-- 记 号 强 于 O- 记 号 。 从 集合 论 和 角度 说 ，B(g(tm)<O(g(o)。 我 们 已 
证 机 任意 二 次 函数 an*+Hbn+ela> 0 属于 Ba]， 因 而 任 一 个 二 次 函数 也 属于 On3。 更 令 人 
吃惊 的 是 任 一 个 线性 函数 an+b 也 在 On 中， 这 由 e=a+bl 和 pno= 1 就 可 证 明 。 

有 些 式 子 如 n= On2)， 对 某 些 曾 见 过 O- 记 号 的 读者 来 说 可 能 有 些 奇怪 。 文 献 中 的 O- 
记 导 有 时 被 非 正式 地 用 来 描述 新近 确 界 ， 这 在 前 面 是 用 @@ 一 记号 来 定义 的 。 在 本 书 中 ， 当 我 
们 写 fmm=Oetmnb) 时 ， 只 是 说 明 gm 的 某 个 常 倍数 是 人 m) 的 渐 近 上 界 ， 但 反映 不 出 该 上 界 有 
洛 紧 确 。 现 今 有 关 算 法 的 文献 中 都 将 渐 近 上 办 与 渐 近 上 确 界 加 以 了 区 分 。 

利用 O- 记 号 ， 我 们 常常 能 通过 查看 算法 的 总 体 结构 来 播 述 算法 的 运行 时 间 。 例 如 ， 第 
一 章 播 人 排序 算法 中 的 二 重 循环 结构 立即 能 引出 其 最 坏 情 况 运行 时 间 的 -一 个 上 界 为 O(n3): 内 
循环 的 代价 由 O(I( 常 量 ) 从 上 克 限 界 ,下 标 和 j 最 大 可 取 到 n， 内 循环 对 n2 对 ;和 j 值 中 
的 每 一 对 至 多 只 执行 一 次 。 

O-- 记 号 是 用 来 表示 上 界 的 ， 当 我 们 用 它 来 对 算法 的 最 坏 情况 运行 时 间 限 界 时 ， 我 们 也 
隐 含 地 给 出 了 对 任意 输入 的 运行 时 间 的 上 界 。 因 此 ， 播 人 排序 在 最 坏 情 况 下 运行 时 间 的 上 界 
On) 就 对 任何 输入 都 成 立 。 但 是 ， 界 B(o?) 却 不 是 对 每 种 输 和 人 都 成 立 。 例 如 ， 若 输入 数组 是 
已 排序 的 ， 则 运行 时 得 为 @(n)。 

从 技术 上 看 ， 该 播 人 排序 的 运行 时 间 是 D(n3 有 点 不 合适 ， 因 为 对 特定 的 n， 实 际 运 行 
时 间 与 具体 输入 有 关 。 也 就 是 说 ， 运 行 时 间 并 非 是 一 个 真正 的 n 的 函数 。“ 运 行 时 间 为 
Ona2" 是 指 最 坏 情 况 运 行 时 间 为 Do 


总 一 记号 


正如 如 - 记 号 给 出 了 一 个 函数 的 汤 近 上 界 ， 纪 一 记号 给 出 了 范 数 的 渐 近 王 界 。 给 定 末 数 

gm，omgn) 是 指 函 数 集 
Qtgfn))={fm), 存 在 正常 数 c 和 no 使 0<cg(n)<<fn)， 对 所 有 n2>mno 成 立 } 

0 一 记号 的 直观 意义 由 图 2.1(O 说 明 。 对 所 有 位 于 no 右边 的 nm 值 ，fn) 的 值 都 大 于 等 于 
Enyj。 
” ”根据 到 目前 为 止 我 们 所 给 出 的 各 渐 近 记号 的 定义 ， 容 易 证 明 下 面 的 重要 定理 ( 见 练习 
2.1 一 引 。 

定理 2.1 对 任意 两 个 函数 ftn) 和 gfn)，fono)=G@lgn) 当 且 公 当 fm=Olgny) 和 
fm = Olegtn))。 

图 为 应 用 本 定理 的 一 个 例子 ， 在 证 明了 an*+bn+He= BO 其 中 a，b，c 为 常数 ，a> 日 
就 立即 能 引出 an2+bn+c= Qo5 与 an2Hbn+c= On。 在 实际 应 用 定理 2.1 时 ， 一 般 不 是 由 
渐 近 确 界 来 导出 渐 近 上 下 界 ， 而 常常 是 从 新 近 上 乔 积 渐 近 下 界 证 上 明 出 汪 近 确 界 。 

为 为 史 -- 记 号 描述 了 源 近 下 界 ， 当 用 它 来 对 一 个 算 迁 最 佳 情 况 运 行 时 间 限 界 时 ， 也 隐 含 
-移出 了 在 任意 输入 下 运行 时 间 的 界 。 例 如 ， 揪 人 排序 的 最 佳 情况 运行 为 中 (mm， 这 风 信 着 该 
算法 的 运行 时 间 为 吕 (n)。 

插入 排序 的 运行 时 间 介 于 RD 和 On 之 间 ， 因 为 它 是 一 个 介 于 mn 的 线性 函数 和 二 次 函 
数 之 间 的 一 个 函数 。 更 进一步 ， 这 两 个 界 从 渐 近 意 久 上 来 讽 是 斥 可 能 紧 确 的 :例如 ， 反 人 排 
序 的 运行 时 间 不 是 Qi， 因为 当 输 人 数组 已 排 好 序 时 ， 运 行 时 间 为 @(m。 但 该 算法 的 最 坏 
情况 运行 时 间 是 Ra 这 一 点 上 两 者 又 是 不 矛盾 的 。 当 我 们 说 一 个 算法 的 运行 时 间 ( 无 修饰 ， 
语 ) 是 Regnb 时 ， 是 指 对 每 一 个 nm 值 ， 无 论 取 该 规 获 下 什么 样 的 输 和 人 ， 输入 集合 上 的 运行 时 
间 都 至 少 是 一 个 党 数 乘 上 gtni( 涯 贡 是 够 大 时 )。 


方程 中 的 渐 近 记号 


我 们 已 经 见 过 了 渐 近 记 导 在 数学 公式 中 的 应 用 。 例 如 , 在 前 面 介 绍 O- 记 号 时 ， 有 

= O(o5"。 我 们 还 可 以 写 2n2+3n+1= 2n2+H@(m。 那 么 如 何 解释 这 些 式 子 呢 ? 

当 渐 近 记 号 只 出 现在 等 式 的 右边 ， 如 nm=On)， 我 们 已 经 定义 过 了 等 号 即 玫 示 集合 的 
成 员 关 系 : nE O(o)。 但 一 般 来 说 ， 当 渐 近 符号 出 现在 一 个 公式 中 时 ， 我 们 将 其 解释 为 代表 
某 些 匿名 函数 。 例 如 ， 公 式 2n2+3n+1= 2n2HBn) 意 即 2n02+H3n+1=2n RD 其 中 fn) 是 某 
个 属于 集合 @@(o) 的 函数 ， 此 处 Ko) 一 3n+1， 确 实在 日 (中 中 。 

汤 近 表示 的 这 种 用 法 可 以 略 去 一 个 方程 中 的 无 关 紧 要 的 细节 。 例 如 ， 在 第 _- 章 中 我 们 将 
合并 排序 的 最 坏 情 况 运行 时 间 表 示 为 递归 式 

TIm=2T 7 2)+ 忆 (DJ) 

如 果 我 们 仅 对 To 的 渐 近 行为 感 兴趣 ， 则 没 必 要 写 出 所 有 低 阶 项 ， 它 科 都 被 包含 在 由 
四 (mm 表示 的 国 数 中 。 

一 个 表达 式 中 的 著名 函数 的 个 数 与 渐 近 记 叶 出 现 的 次 数 是 一 至 的. 例如 ， 在 表达 式 


中 ， 只 有 一 个 工 和 名 函数 (是 i 的 函数 )。 这 个 表达 式 与 OLD+HOC)H…+Otn) 不 同 ， 后 者 没有 明 
确 的 售 尺 。 

有 时 ， 渐 近 记 号 出 现在 等 式 的 左边 ， 奶 

2 针 外 (加 一 日 (GO 

这 时 就 根据 以 下 规则 来 解释 这 种 方程 ,无 论 等 号 左边 的 严 名 函数 如 何 选 择 ， 总 有 办 法 选 . 
取 等 叶 右 边 的 某 名 函数 使 等 式 成 立 。 这 样 ， 上 例 的 含义 即 对 任意 函数 fn)k Btn)， 存 在 函数 
gDEC Ga)， 使 对 所 有 n，2n+8m= Sm。 换言之 ， 方 程 右边 提供 了 较 左 边 更 少 的 细节 。 

一 组 这 样 的 关系 可 以 链 起 来 ， 如 

2n2T3n 上 1 = 202 四 人 n) 
一 人 (全 

我 们 可 以 用 上 述 的 规则 对 每 一 个 方程 分 别 解释 。 第 一 个 方程 说 明 存 在 函数 ftn)E Gin)， 
使 对 所 有 mn 有 2n +3n+1=2n +Hfo。 第 二 个 方程 说 明 对 任意 函数 gln)E @tn)， 存 在 函数 
htE @ftn )， 使 对 所 有 mn 有 2n2+g(m=(n)。 请 注意 这 个 解释 隐 含 着 2n02H3nT1= Ba2)。 
些 即 以 上 方程 链 的 直观 结论 。 


吕 一 记号 


O-- 记 号 给 出 的 渐 近 上 界 可 能 是 也 可 能 不 是 渐 近 紧 确 的 。 界 202= Ona3 是 渐 近 紧 确 的 ， 
但 加 =Ona) 却 不 是 的 。 我 们 用 O- 记 号 来 表示 非 渐 近 紧 确 的 上 界 。O 人 eto)) 的 形式 定义 为 

Oo) = tn): 对 任意 正常 数 c> 0， 存 在 常数 no>0， 使 对 所 有 nmn2>nb， 有 

0Oecfftny<cegftn)} 

例如 ，2n=Oa”)， 但 2n02 二 Oo。 . 

o- 记 号 与 O- 记 号 的 定义 是 相似 的 ， 主 要 区 别 在 于 对 fp)=O(g(n))， 界 0<ftn)<ccg(n) 
对 某 个 常数 c>0 成 立 ， 但 对 fm=olgfna))， 界 0<fKn)<cg(m 对 所 有 常数 ec>0 成 立 。 从 直 
党 上 看 ， 在 o 一 表示 中 当 n 趋 于 无 穷 时 ， 函 数 ftn) 相 对 于 go) 来 说 就 不 重 蔓 了 ， 即 


limztm - (2.1) 


某 些 着 者 将 这 个 极限 式 作 为 o- 记 号 的 定义 ;本 书 中 给 出 的 定义 也 同样 限定 匿名 函数 必须 
是 渐 近 非 负 的 。 

纪 一 记号 

0 一 记号 与 风 一 记号 就 如 同 o- 记 号 与 CO- 记 号 一 样 ， 它 用 来 指示 非 渐 近 紧 确 的 下 界 。 它 
的 一 种 定义 是 

fen)e clg(n)) 当 且 仅 当 gmE offony)。 
cotg(n 的 形式 定义 为 
olg(n))={Rn)h: 对 任意 正常 数 c>0， 存 在 正常 数 no>0， 对 所 有 nn， 有 0< 
cg(n) 一 fn)} 
例 好 ， ni 2 on， 但 下 /2 二 own。 关系 Km = we(n)) 隐 含 着 
于 


1m 一 一 一 的 
oggtD) 


过 


即 当 0 趋 于 无 穷 时 ，ftm 相 对 gm 来 说 变 得 任意 大 了 。 
不 同 函 数 间 的 比较 
许多 实数 集 上 的 大 小 关 杀 用 于 渐 近 比较 也 是 成 立 的 。 下 让 假设 fn) 和 gfn) 是 渐 近 正 值 


的 。 

传递 性 
fo 一 怠 (gG) 和 Rom)= 提 (hn) 殖 合 fm=Ghn)) 
fo=OeoD) 和 go=oOhmh 区 含 Km=Ohon) 
代 站 一 Cn 和 中 本 一 Rhlm) 菊 含 fn)=Qlhn)) 
fo=cotegn 和 gm=olhon)) 草 含 ft)=olhtny) 
fnD) 一 cofgtoj 各 只 0 一 chfoa 放 类 含 ffn)=efhfn 人 

自 返 性 
Rn)=Gron)) 
ff 站 一 COGn)) 
fm 一 fnoy) 

对 称 性 
人 =Gtfn) 当 且 仅 当 gm = ettm) 

置换 对 称 性 


fn= Offfo) 当 且 权 当 gm= Gon)) 
Ra)= offn))y 当 且 仅 当 gm)= ofny 
图 为 这 些 性 质 对 渐 近 记 叶 也 成 立 ， 我 们 可 以 在 两 个 实数 a 和 hb 之 闸 的 比较 与 琐 数 fn 和 
gm 之 间 的 渐 近 比较 作 一 类 上 比 ， 


ft 一 On sa<b 
所 D) 一 习 (g(CD 访 忆 azhb 
fn 下 (gtn 习 六 二 和 b 
攻 册 一 OLSLDJ)) 局 aa<hb 
人 DJ 一 cg(nh) 六 >b 


得 实数 集 上 的 一 个 性 质 却 不 能 应 用 网 渐 近 记 续 上 
三 分 性 : 对 两 个 实数 a 和 b， 下 列 三 种 情况 中 恰 有 一 种 成 立 : 
3 <b，a 一 b， 或 a>b 
任 两 个 实数 都 可 进行 比较 ， 但 并 不 是 所 有 的 本 数 都 是 朵 近 可 比较 的 。 对 两 个 函数 fm) 各 
gftm。 可 能 fo)=OenD) 和 8Rm= men)) 都 不 成 立 。 例 如 ， 函 数 n 和 nt" 无 法 利用 靳 近 记 
导 来 比较 ， 因 为 ntfs 中 的 指数 值 变化 于 0 和 2 之 间 。. 


2.2 ”标准 记号 体系 和 通用 函数 


本 节 讨 论 一 些 标准 的 数学 本 数 和 记 导 ， 并 给 出 它们 之 间 的 关系 ， 另 外 偿 要 举例 说 明 渐 近 
记号 的 用 法 。 


一 18 一 


单调 性 


一 个 函数 fa) 是 单调 递增 的 ， 若 m<n 落 含 fm)<fm)。 

类 似 地 ， 基 数 fm 是 单调 递减 的 ， 若 mm<a 昔 含 fm)>>fn)。 
隔 数 fa) 是 严格 递增 的 ， 若 中 <n 曹 低 fm)<fn)。 

苑 数 ftp) 是 严格 递减 的 ， 若 症 < 落 售 ftm)>ftn)。 


底 (FloonD 和 项 (Ceiling) 


对 任 一 个 实数 x， 最 大 的 小 于 或 等 于 x 的 整数 表示 为 | xj ( 读 作 天 的 底 )， 最 小 的 大 于 或 
等 于 x 的 整数 记 为 [x 1( 读 作 x 的 顶 )。 对 任 一 个 实数 x: 
X1 < xX <xXS [1<x+l 
对 性 一 个 整数 n， 
rav21+lnv2 一 上 
对 任 疼 整数 mp 和 整数 as 天 0，b- 二 0， 


Jrnaxallxvb = faxvab1l 人.3) 
Laal bj = 一 | nabj (2.4) 
底 画 数 和 顶 函 数 是 单调 递增 的 。 
多 项 式 
给 定 一 个 正 整数 d， 了 33 的 4 次 多 项 式 是 具有 如 下 形式 的 末 数 ptnj: 
Ptn) 一 工 a mn， 


其 中 常数 au，al，…，ai 是 多 项 式 的 系数 ， 且 au 天 0。 一 个 多 项 式 是 渐 近 正 的 ， 当 且 仅 当 
au>0。 对 一 个 由 次 的 渐 近 正 才 项 式 pm 和 ， 有 P(m= Bo0])。 对 任意 实 常数 a>>0， 函 数 焉 单 
调 递增 ; 对 a<<0， 函 数 ms 单调 递减 。 说 函数 ftn) 有 多 项 式 界 ， 有 fm)= nc 0， 也 即 对 某 个 
常数 ，ftm) 一 On 兄 练 习 2.2 一 仿 ， 


指数 式 - 
对 任意 a 关 0.m 和 mn， 有 等 式 ， 


_ 
a 一 ] 
a -8 
8 一 1Za 
(让 一介 六 

对 任意 na 和 a2>1， 函 数 aa 单调 递增 、 方 便 的 情况 下 ， 我 们 将 假设 外 = 1. 

多 项 式 的 增长 率 和 指数 式 的 增长 率 可 通过 下 列 事 实 联系 起 来 。 对 任意 常数 a 和 b， 且 
a>1， 有 ， 
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tm2_ 一 0 3 
2a 鸣 加 。 s 
”根据 此 式 可 得 出 
D” 一 ofao) > 

可 以 看 出 任意 正 的 指数 范 数 较 任 意 的 多 项 式 增 长 得 更 快 。 
用 e 表 示 2.71828…; 对 任意 实数 x: 


oj 


e 一 1+x+ 二 73! 十 站 (2.6) 
其 中 4 ?表示 阶乘 函数 。 对 任意 实数 x， 有 

以 二 十 天 . 人力 
当 X=0 时 等 号 成 立 。 当 人 | 所 1 时 ， 有 近似 式 : 

1] 十 天 近 人 过 二 十 驻 十 天 (2.8) 


当 x=0 时 ， 用 14+x 来 近似 仿 就 相当 好 了 ， 

ex 一 ] 十 X 十 加 (fx 
(在 这 个 方程 中 ， 渐 近 记 号 是 用 来 描述 当 x-=0 而 不 是 Xee 时 的 极限 行为 的 })。 对 任意 
x， 有 


lim (1 + 芭 】 一 名 
人 一 吧 联 ， 
对 数 式 


我 们 将 用 到 下 列 记号 ， 
1gn 一 logonf 以 2 为 底 的 对 数 ) 
Inn 一 logn( 自 然 对 数 ) 
gm=(lg nx( 指 数 化 ) 
lglgna=jlg(lgny( 复 合 ) 
一 个 重要 的 表示 上 的 约定 是 “对 数 函 数 仅 作用 于 公式 中 的 紧 下 一 项 "， 例 如 地 ntHk 就 表 
示 (1g t+Hk， 而 不 是 lg (n+k)。 对 m>0 和 hb>1， 郴 数 logian 是 严 格 递增 的 ， 
对 任意 的 实数 a>0，b>0，c>0 和 mn: 
笃 一 hb ” 


log (ab) =]og.a 十 log_b 


log a 一 mhlog\a 


log, a 一 - 一 一 


gb 一 Dieoges (2.9) 


因为 改变 一 个 对 数 的 底 上 只 将 对 数值 改变 了 一 个 常数 因子 ， 故 我 们 在 不 注意 这 些 常数 因子 


时 就 采用 ”lgn" 记 号 ， 就 像 一 记号 一 样 。 计算 机 工作 者 党 浓 认 为 对 数 的 底 取 2 最 自然 ， 因 
而 很 光 算 法 和 数据 结 村 都 幸 涉 到 对 问题 进行 二 分 。 
当 | 中 < 天 1 时 ， Int1+ 允 的 一 个 简单 级 教 展开 为 : 


-有 
tnhll 十 3 一 其 十 本 十 5 
当 X>-1 村 ， 还 有 以 下 不 等 式 成 立 ， 


更 
区 . 
二 过 lnfl 二 x) 5 (2.10) 


在 X 一 曲 时 ， 等 号 成 立 。 
如 果 ftm= 地”n， 则 说 函数 fm 是 多 项 对 数 有 界 的 。 在 方程 (2. 另 中 ， 通过 用 lgn 符 代 
n 和 ?2 埋 代 a, 可 以 将 多 项 式 的 增 长 率 和 多 项 对 数 的 增长 率 联系 起 来 : 





im 了 2 一 limgn -0 
0 一 芝 汶 ” n 一 co 和 
由 此 极限 式 可 得 对 任意 尚 数 a>0， 有 : 
lg ”mn 一 on ) 
因而 ， 任 意 正 药 黎 项 式 末 数 较 密 项 对 数 明 数 增长 得 要 快 。 
阶 笋 
n! 【《 恋 作 nm 的 阶 磁 ) 记 号 的 定义 为 对 所 有 整数 n2>6: 
1 如 果 n = 
nl 一 
nn 一 1 如 果 n>n0 


据 此 ，nl =1 .2. 3 
阶乘 函数 的 一 个 弱 上 界 为 mL < 扫 m， 因 为 在 阶 科 中 每 一 项 至 多 是 mn。Stiring 近似 公式 为 


uv 谭 (中 (+ef) ea 
其 中 e 是 自然 对 数 的 底 。 这 个 公式 给 出 了 一 个 更 紧 确 的 上 界 和 下 异 。 利 用 此 式 可 以 证 明 : 

nl 一 On 

nl 一 20) 


域 (af )}= 马 mn 过 D) 
对 所 有 a， 下 列 界 也 成 立 ， 


六 120)》 


V2rn () 所 人 拟 2ze 人 (2.12) 
全 心 
多 重 对 数 函 数 
我 们 用 记号 *tg*n* 来 表示 多重 对 数 。 对 非 负 整 数 i， 函 数 lg0n 的 递归 定义 如 下 ; 
刁 1 一 改 
log hn -ee 5 知 i > 0 且 1g mn 
天 天 定 六 车 ji > 0 且 lgo ns 0 或 jg pn 无 定 久 


注意 要 将 lgan 与 lgin 区 别 开 来 。 多 重 对 数 函 数 的 定义 为 
gm 一 minfi0lg on<1} 


-一 2L1 一 


多 重 对 数 是 一 种 增长 很 慢 的 陆 数 : 
ig*2 一 1 
lg*4= 2 
把" = 一 3 
1g 65536 一 人 4 
1g (265536) 一 5 
可 观察 到 的 宇宙 中 的 原子 数 估计 约 有 109 个 ， 远 远 小 于 225555， 因 此 、 我 们 很 少 会 疯 到 
使 刀 "n>s 的 nm 值 ， 


斐 波 那 契 数 


意 波 那 契 数 递归 地 定义 为 : 
Fu=0 
Pi=1 (2.13) 
中 ii 一 Ri 十 Fi>2 

每 一 个 数 都 是 前 两 个 数 的 和 ， 这 样 产 生 的 一 个 序列 为 1,1,2,3,5,8,13,2134,33，。 

斐 波 那 契 数 与 黄金 分 割 率 @ 及 其 共 令 数 生 有 联系 : 











中 ~ 一 5 = 1.61803… (2.14 
市 =: -5 一 .61803 

特别 地 ， 有 ， 
F = 一 站 .3 


这 可 用 妇 纳 法 证 明 《 练习 2.2 一 刀 。 因 为 | 中 | < |， 有 上 团 人 /NS <UzVS <172， 因而 
第 ;个 斐 波 那 梨 数 等 于 和 由 /5 最近 的 整数 ， 这 说 明 斐 波 那 契 数 是 曙 指 数 增长 的 。 


思 考 题 


2-t 多 项 式 的 渐 近 性 访 


设 ptm)= 了 am， 其 中 aa >0 是 一 个 n 的 d 次 多 项 式 ，k 是 一 个 常数 。 利 用 渐 近 记 寻 的 


定义 来 证 册 下 殉 性 质 ， 

a, 著 k>d， 则 pP(m=Ono 
. 若 k<cda， 则 bo 一 Don 
若 k=d， 则 pm=Ba9? 
. 车 >d， 则 pta)= ono 
车 k<d， 册 pm 一 on 


mm 己 D 如 


2-2 相对 渐 近 增长 


在 下 表 中 ， 对 每 一 对 (A，B) 请 指出 A 与 B 的 关系 中 ，O，o，G，w，@ 郧 一 种 成 立 ， 
想 设 k21，5g>0，c> 1] 痢 是 党 数 ， 在 格子 中 境 * 是 ”或 “和 否 " 即 可 。 





2-3 根据 渐 反 增长 率 排 麻 


a. 厄 据 增 长 率 来 对 于 列 函 数 排队 即 找 出 画 数 的 一 种 排列 外 ， 玉 ，…，g， 使 
吕 | 一 CE?)}、 申 2 一 CE3)、 本 E2 一 名 (En)。 将 该 序列 划分 成 等 价 类 ， 使 fn 和 Sm) 在 同一 等 价 
类 中 ， 当 月 仅 当 fm = 印 (gtn))。 


IClg*n 2 (Vs 是 nt 0g n)1 
3 2 得 1g2m 霹 {p1 3) 人 2 nl? 呈 
坛 让 启 “mn mn ww 2 站 旺 理 " 谨 和 

2 ( 攻 m)sa en 4 (pn 十 1! VE 
坦 " 必 井 六 ] 2 w328n 2 nm 区 nn 32nT1 


b， 请 给 出 一 个 非 旬 冰 数 Roy， 郁 得 对 任意 一 个 在 (a) 中 的 函数 gtm，fn) 慨 不 是 OUglabh 
耻 不 是 避 (mn])。 

2-4 渐 近 记号 的 性 质 

设 fa) 和 gn) 为 新近 让 函数 。 证 明 莽 将 证 以 下 的 假设 : 
. Ko= On)) 苑 售 En= On) 


b，ffryHgtm) 一 加 (nuinfn)，go) 
fn)=OD(gtnD) 芍 含 1g(Rn = 一 Qtig(gtn)) 其 中 1e(g(n)>0 日 人 ny>i， 对 足 各 太 的 mn 成 


取 


人 


.Km=Oetn) 芍 舍 20=OGe) 
fm=eOfftny) 
RnO= OnD) 殖 含 En 一 don) 
. 女 吕 一人 @(ftn 7 2 
- 枚 njHoRnDb) 二 人 (Rn) 


go 郧 人 


条 


2-5 个 和 所 的 一 些 变形 


某 些 作 者 定义 @ 的 方式 与 我 们 略 有 不 同 ， 我 们 可 用 名 来 表示 这 另 一 种 定义 .说 fa =Q 
(gtn)， 若 存在 正常 数 c 使 fnj>>cg(m)>>0， 对 无 穷 多 的 整数 mn 成 立 。 
a_ 说 明 对 渐 近 非 负 的 画 数 Ko) 和 gtn)， 或 者 Km =Ogtaj)， 或 者 fm= Qtgtny] 成 立 ， 或 


者 两 式 都 成 立 ; 但 在 用 吕 取代 D 时 则 不 成 立 。 


b. 请 措 述 一 下 用 9 代替 马 来 刻 划 程 序 的 运行 时 间 法 在 优点 和 缺点 。 


某 些 作者 定义 的 DO 也 略 有 不 同 ， 设 为 D7- 说 Rm=Oe)) 当 且 仅 当 IKnl= OUg(n)。 
c. 在 此 新 定义 下 ， 定 理 2.1 的 “ 当 且 仅 当 "的 两 个 方向 各 有 什么 变化 ? 

某 些 作者 定义 的 各 (表示 O 〇 ) 略 去 了 对 数 因 子 : 

Glg(m) 一 fo) 存在 正常 数 c，k， 和 m 使 0<cffnj<ccgfn)lgkn)， 对 所 有 n2>nu 成 立 } 
d. 请 类 似 地 定义 总 和 名 。 并 证 明 与 定理 2.1 相应 的 类 似 关系 。 


2-6 多 量 函 数 


在 j" 琐 数 中 用 到 的 重复 操作 符 “* "也 可 用 到 在 实数 域 上 单调 递增 的 函数 上 。 对 某 个 满 
足 ffn<n 的 函数 好 递归 地 定义 fi 如 下 ， 
pa- 人 他 。 允 >9 
于 对 1 = 小 
对 一 给 定常 数 ceR， 定 义 多 重 郴 数 为 ， 
人 (一 minfiz 0 六 (OO 芭 ec 本 
该 函数 不 必 针 对 各 种 情况 定义 。 换 诗 之 ， 站 tn) 是 为 使 其 自 变 量 小 于 等 于 ec 而 重复 应 
用 f 的 次 数 ， 
对 下 列 每 一 个 郑 数 fn 和 稼 数 c， 请 给 出 f 人 on) 的 尽 可 能 紧 确 的 界 。 





练 习 二 


2.41-1 设 fm 和 go) 都 是 渐 反 非 负 的 阔 数 。 请 利用 曙 -- 记 号 的 基本 定义 来 证 明 maxtfrn)， 
gm 一 人 人 fn)+efn)。 
2.1-2 证 明 对 任意 实 常 数 a 和 hb， 其 中 b>0， 有 (n+Halb 一 所 (nb) (2.2) 
2.1-3 请 解释 “算法 各 的 运行 时 间 和 车 少 是 O(n" 这 和 句 话 为 什么 是 上 下 文 无 关 的 。 
2.1-4 2 一 操 C0) 成 立 吗 ? 2 一 Of29 成 立 吗 ? 
2.1-5 请 证 明定 理 2.1. 
2.1-6 证 明 : 一 个 算法 的 运行 时 间 是 ec 涯 利 仅 当 其 量 坏 情况 运行 时 间 是 Diglna))， 其 最 佳 捕 况 ， 
运行 时 间 是 feny。 
2.1 一 7 证明 elgltny 门 mg 是 空 集 。 
2.1-8 可 以 将 我 们 的 表示 法 扩展 到 有 两 个 以 不 同 的 速率 独立 地 赵 于 无 穷 的 参数 n 种 的 情 彤 。 对 给 
冠 的 函数 ggnm，O(gtnomy) 为 函数 集 
Olgln:m7= :tfnmjj 存在 正常 数 cno 和 m0， 使 对 所 有 nm 及 下 >m0、 有 0< fnom< 
cgfnun)} 
请 缩 出 对 应 的 中 (gtn:mD) 和 Gegfnum 力 的 定义 。 


2.2-1 赤 明 : 莒 全 n 和 Bm 是 单调 递增 的 函数 ， 则 RnyHegtn) 和 Ti 是 单 国 递增 的 车 ftn) 和 gm 是 可 
法 非 负 的 ， 则 fo) .gm 是 单调 递增 的 ， 

2.2-2 利用 台 - 记 有 导 的 定 交 来 证 明 ， Tony= no0b 当 且 怪 当 存在 k>0 使 Ts=Oen 小 

2.2-3 证 明和 等 式 人 .只 

2.2-4 证 明 1lpn! )= 人 1 及 0 = 一 on ). 

4.2-5* 盖 数 Tlgnl 是否 多 项 式 有 界 ?函数 [lglgnl ] 呢 ? 

226* 哪 一 个 在 渐 近 由 更 大 些 ; lg 匡 还 是 1 (lm 和 _ 

2.2-?7 用 归纳 法 证 明 ; 第 i 个 斐 波 那 净 数 满足 不 等 式 Fi= ( 呈 -@ ) 7/ VS， 其 中 四 是 黄金 分 割 率 ， 押 是 其 

228 下 明 :对 i>0， 第 人 H2) 个 韭 波 那 契 数 满 足 F ,>>d 


第 三 章 ” 求 和 运算 


当 一 个 算法 中 有 循环 控制 结构 如 while 或 fr 循环 时 ， 其 运行 时 间 相 有 冉 循 环 伍 每 执行 -- 
次 的 时 间 的 和 来 表示 。 

理解 如 何 对 租 式 进行 操纵 以 及 和 式 的 限界 是 重要 的 (我 们 将 在 第 四 章 中 看 到 ， 在 骨 某 些 
方法 解 递归 式 时 也 会 出 现 和 和 式 )。 

本 章 将 给 出 有 关 和 式 的 一 些 基本 公式 ， 并 提供 一 些 对 和 式 限 办 的 有 出 技术 。 


3.1 求 和 公式 和 性 质 


给 定 一 列 数 al，as。、…，au 有 限 和 ai+an+…+an 可 以 寻 作 
若 a = 该 和 式 的 俩 被 定 六 为 07 著 n 不 是 整数 , 则 假设 其 上 极限 是 上 naj， 类 似 地 , 藻 伍 
k=x 处 开始 求 和 ,x 不 是 整数 , 岂 假 定 该 和 式 的 初始 值 是 上 xj (-- 般 地 , 我 们 会 明确 地 写 出 底 
歼 数 和 项 函数 )。 一 个 有 穿 级 数 的 值 总 是 有 明确 定义 的 , 及 其 作 项 可 抠 任 意 次 序 相 加 ， 
给 定 一 列 数 昌 19 总 2 无 穷 租 和 十 3 十 可 以 写作 
六 ah 


其 售 义 即 


him 2 8， 


车 该 极限 不 存在 ， 该 级 数 发 散 ; 否则 ， 该 级 数 收 剑 。 收 敏 级 数 的 各 项 并 不 所 能 按 任 意 次 
序 相 加， 但 可 以 重 排 绝对 收 敏 级 数 的 各 项 次 序 。 


线性 性 质 

对 任意 实数 c 和 有 限 序列 aa ，a，…，a 与 bb，b，.…，b 
Zea 二 b 一 ea， 十 Zu 

这 种 线性 性 质 对 无 穷 收敛 级 数 也 成 立 ， 

线性 性 质 可 被 用 来 操纵 含有 渐 近 记号 的 和 式 ， 例 如 
Z edto) = ef 2 ro 


在 此 方程 中 ， 久 - 记 号 在 左边 作用 于 变量 k， 但 在 右边 是 作用 在 n 上 的 。 这 些 变换 也 可 
应 用 于 无 穷 收 敏 级 数 上 。 


算术 级 数 
我 们 在 分 析 插 人 排序 时 ， 遇 到 过 和 式 


，》K 一 1 十 2 十 … 十 姑 


这 是 个 算术 级 数 ， 其 全 为 
kx= na+Db (3.) 
= @fn ) (3.2? 
几何 级 数 


人 一 二 十 X 十 X 十 守 十 和 


和 =- 贞 


是 -- 个 上 玫 何 ( 或 指数 ) 级 数 ， 其 代为 
-一 
》X 二 rr {3.3) 


若 此 和 式 为 无 穷 理 jx < 1， 则 有 无 穷人 下降 上 几何 级 数 


中 ， 


YX 一 (3.4) 


=: 一 式 








调和 级 数 
对 正 整 数 n， 第 nm 个 调和 数 为 


一 Inn 二 Ofi) (3.5} 
积分 级 数 与 微分 级 数 
对 上 面 的 公式 进行 积分 或 微分 可 得 到 另 一 些 公 式 。 例 如 对 (3.4)} 式 了 两边 微分 并 乘 以 得 : 


kx = 一 一 一 (3 加 
之 《1 一 区 


套 适 级 数 
对 任意 一 个 序列 和) 六 


> e， 一 ai 一 站 一 3 (3.7) 


业 二 于 


因为 每 一 项 as ，a,，…，a ,被 加 和 了 减 各 一 次 。 这 样 的 和 起 称 为 套 选 和 式 。 类 似 地 ， 


Ze,- ai 1 一 an 一 3。 


作为 一 一 个 例子 看 下 面 的 级 数 
1 
二 KE 了 
我 们 可 把 每 一 项 重 写 为 
1 1 1 
kk 二 1 X K+l 
则 有 


1 - 工 仁 - 1 )- _ 工 
之 KETT 一 之 kk 攻 十 上 于 


k 





积 
有 和 穷 祝 引 32 8a 可 写作 
II a， 


K>=1 


如 果 n =0， 定 义 该 积 的 值 为 1 通过 下 面 的 等 式 可 以 将 一 个 含 积 的 公式 转换 成 含 和 式 
的 会 式 
虹 ( 开 sj) = en， 


= 1 


3.2 和 式 的 办 


当 用 和 式 来 表示 算法 的 运行 时 间 时 ， 有 很 多 技术 可 用 来 对 其 进行 限 园 。 下 面 是 某 些 最 党 
几 的 方法 。 


数学 归纳 法 


. 二 ， 
对 一 个 级 数 求 值 的 最 基本 的 方法 就 是 数学 归纳 法 。 例如， 要 证 明 算 术 级 数 上 kk 的 值 为 7 


nn 十 了。 容易 证 明 这 个 结论 在 nm 一 ] 时 成 立 ， 作 归纳 鼻 设 为 对 成 耻 ， 着 望 证 明 对 n+ 十 1 风 
成 立 。 我 们 有 


nm 十 | 


》 KK 一 x+o+D 


5nn 十 1 十 人 二 匡 
= 本 + Da 十 习 
数学 归纳 法 还 可 用 来 给 出 和 式 的 异 。 例 如 ， 要 证 明 几何 级 数 对 ,3 是 0(3 ) 的 。 更 具 


体 点 ， 要 证 明 对 某 个 常数 c， 2 3 < 当 了 =0 时 ， 有 卫生 =1<c， 1， 这 只 要 c 
> 1 即 可 ， 假 设 界 对 守成 立 ， 现 证 明 它 对 天 十 1 也 成立 : | 


刀 十 上 


工 3 末了 二 3 


三 一 候 


所 c3 "十 3 


下 十 1 
| 


这 只 要 证 明 (1Z3+17 昌 和 1， 亦 即 c> 372 即 可 。 这 样 就 有 ， 3 一 0G ). 
在 利用 归纳 法 证 明 界 时 ， 若 用 到 渐 近 记号 则 要 格外 小 心 。 看 下 面 一 个 关于 闷 上 = On) 


的 错误 证 明 。 当 然 ， 半 ， 上 = O(D)。 假 设 界 对 成 立 ， 现 要 证 明 对 王 十 1 也 成 立 。 


2k 一 x+e+D Y 


=Om+tnr+Dl) 二 这 步 错 了 1 
一 O 〇 fn 十 二 


证 明 中 的 错误 在 干 由“O* 隐 藏 起 来 的 常数 随 n 而 增长 ， 因 而 不 再 是 常数 。 我 们 没有 证 明 
同一 个 常量 对 所 有 的 n 都 能 起 作用 。 


对 项 的 限界 


有 了 时， 通过 对 级 数 中 的 各 项 限界 也 能 获得 一 个 很 好 的 级 数 的 界 . 通常 的 做 法 是 用 最 大 项 
做 为 各 项 的 界 。 例 如 ， 算 木 级 数 (3.1} 的 一 个 上 界 为 


1 < 将 全 长” 


一 般 来 说 ， 对 一 个 级 数 》 a ,车 设 a 一 max 出 


所 na ， 


用 最 大 项 来 作为 级 数 中 各 项 的 界 是 一 种 较 绊 的 方法 ， 因为 实际 上 可 用 几何 级 数 来 限 
界 。 给 定 级 数 六 ,el,， 假 设 对 所 有 kz0 有 ai;i /ak 和 r 其 中 r<1 是 个 常数 。 因为 a， 


翌 ， 故 该 级 数 的 和 可 用 一 个 无 穷 下 降 的 几何 级 数 来 限 答 ， 则 有 


一 2 一 


还 可 用 这 个 方法 对 卫 ， 人 kg/ 3"] 跟 界 。 该 级 数 的 首 项 是 1/ 3， 且 对 所 有 的 k > 1， 连 续 
两 个 项 的 比值 为 ，， 
伙 上 DA3 
K7/ 3 


AR 





3 一 273 
_ 

在 运用 这 种 方法 时 常 易 犯 这 样 的 错误 ， 就 是 在 说 明了 连续 两 个 项 的 比值 小 于 1 后， 就 
很 设 和 式 可 裕一 几何 级 数 限界 。 有 一 个 例子 是 无 穷 调和 级 数 : 


= im 全 (pgn) 
一 芭 
因而 该 级 数 是 发 若 的 。 在 这 个 级 数 中 ， 第 (krD 项 和 第 项 的 比值 为 ky Gk+D<1， 但 
它 并 不 能 由 一 个 下 降 的 几何 级 数 来 眼界。 为 了 能 做 到 这 点 ， 必 须 证 明 连 续 两 项 的 比值 要 远 小 
于 1 苑 要 存在 常数 5<1， 使 所 有 两 个 连续 数 的 比值 不 超过 r。 在 调和 级 数 中 ， 不 存在 这 样 
的 r， 所 有 的 比值 都 与 1 任意 接近 
分 解 和 式 


如 果 某 些 级 数 的 界 比较 难 找 ， 则 可 将 该 级 数 按 下 标的 范围 分 解 ， 再 对 每 一 个 子 级 数 找 出 
界 。 例 如 ， 假 设想 找 出 算术 级 数 并 " 。，Kk 的 一 个 下 界 ， 已 知 其 上 界 为 mn， 读者 可 能 会 想到 用 最 
小 项 来 作为 每 一 项 的 界 ， 但 该 最 小 项 是 1， 故 可 得 到 该 级 数 的 下 界 n， 它 与 上 界 王 相差 很 
大 . 
如 果 先 分 解 该 级 数 ， 则 可 得 到 一 个 更 好 的 下 界 、 为 方便 起 见 设 " 为 偶数 有 
2Zk= 了 kk+ 了 k 


上 一 1 ksnrz+rl 


> 工 0+ 2 各 7 2 


> 7 2 
一 人) 


这 是 一 个 渐 近 确 界 ， 因 为 2，k= OQ )， 


对 在 算法 和 分析 中 让 现 的 和 式 ， 我 们 沼 常 可 以 分 解 和 站 年 忽 覆 初 始 的 上 项， 一 - 般 来 说 ， 
泊 “个 和 趟 互 Coat 中 的 各 大 sk 科 二 4 时 二 可 到 用 此 转 本 ， 芭 对 任意 兴国 ko 0 人 有 


> -了 


让 mn 二 一 


一 从 (1 十 号 


丰 一 上 


所 以 可 以 这 样 写 是 因为 和 式 的 前 面 几 项 都 是 常量 ， 且 项 数 也 是 常量 。 这 样 ， 就 可 以 
用 其 他 一 些 方法 对 于 "at 限界 ， 例 如 ， 为 接 汗 也 二 的 一 个 渐 近 上 界 ， 我 们 注意 到 当 
> 3 时 ， 该 级 数 中 连续 两 项 的 比 信 为 


Gk+i 术 [2 +1_ + 
了 


2 <879 
k ”72 2k” 
原 级 数 可 被 分 角 
2 
3 ZS + 过 到 
幻 ， 
<om+ 人 (人 
= oO0) 


第 一 个 级 数 是 一 个 下 降 的 几何 级 数 。 


级 数 分 解 技 术 还 可 用 来 在 蝎 复 杂 的 一 些 情况 中 确定 渐 近 界 。 例如 
数 (3.5) 的 一 个 界 为 DUgnh 
H = > 


人 1 到 aa 分 成 1 lgnJ 段 ， 每 段 的 上 界 为 1， 就 有 


， 可 以 得 到 调和 级 


rr 
-1 
bd- 
-| 
有 


一 3 一 


一 ]gn+ 1 (3.3) 
积分 近似 公式 
如 果 一 个 级 数 可 以 被 表示 成 并 ,fi)， 其 中 fg) 是 一 个 单调 递增 画 数 ， 我 们 就 可 以 用 积 
分 来 近似 它 : 
ftx)dx 和 过 》 RE 到 六 fxjdx (3.9) 


可 作 这 种 近似 的 原因 可 在 图 3.1 中 可 以 看 出 。 级 数 由 图 中 矩形 区 域 表 示 ， 积 分 为 曲线 下 
阴影 部 分 ， 





tb) 


图 3.1 用 积分 对 罗 "” ffxj 所 做 的 近似 


K im 


“ 当 fo 是 个 单调 递减 的 函数 时 ， 可 用 类 似 的 方法 给 出 界 ， 
六 Rdxs 了 (< 六 foodx .0 


积分 近 拟 式 (3.10) 给 出 了 第 n 个 调和 数 的 一 个 紧 确 的 估计 。 在 考虑 下 异 时， 有 

。 2 > 站” 

-一 1ana+ 有 {3.11) 
对 于 上 界 ， 有 不 等 式 4 


一 lnn 
a 由 上 式 可 得 到 界 


> 委 lnn 十 1 《3.12) 


kk 一 1 


图 中 每 个 矩形 的 面积 示 于 该 矩形 中 ， 而 总 的 年 形 面积 则 表示 了 和 式 的 值 。 积 分 由 曲线 之 


下 的 阴影 部 分 面积 表示 。 通 过 比较 (aj 中 的 曾 积 ， 我 们 有 : 


六 ff CO dx< 了 (go 
然后 通过 将 所 有 矩形 向 右 移 一 个 单位 ， 在 〈b) 中 有 : 


2 TO 友人 f (x) dx 
思 考 题 
”3-1 和 式 的 界 
请 给 出 下 列 级 数 的 闻 近 界 ， 假 设 czz0 和 S2>0 都 是 常量 ， 
8 3K 
b. y lg 
C. y krlgek 
练 习 三 


3.1 一 1 写 出 表示 半 。 ,(2k -- 1) 的 结果 的 简单 公式 。 
3.1 一 2 * 利用 调和 级 数 来 证 明 ， = 17 (kk 一 D= In(yn)+OlD 
31-3 * 说 明史，,kk 一 DZ2 =0 


3.41 -4 * 对 和 式 半 ,Cg + Dx 求 信 。 


f 《DJ 


良 二 人 


3.1 一 利用 和 式 的 线性 性 质证 明 :并 _ ,Or(D)= ZOL 
3 一 6 证 明了 ” Otto) 一 DR) 
3.1 一 7 对 积 H:_ ,2 ,4 求 值 。 


34 一 8 * 对 积 人 tc (1 一 1ZK ) 求 值 


3.2 一 上 和 证明 Y ”17K 由 一 个 常数 从 上 方 限界 。 


3.3 一 2 求 出 和 式 人 fn72 4 的 一 个 渐 近 上 界 。 


3.2 一 3 证 明 在 分 解 油 和 级 数 后 ， 第 # 个 测 和 数 是 Dllign)。 
3.2 一 4 给 出 并 ,k 的 一 个 积分 近 亿 式 


32 二 5 我 们 为 何不 直接 把 积分 近似 公式 (3.10) 用 到 人。 ,1Z 上 上 来 得 到 第 n 个 调和 数 的 二 输 呢 ? 


第 四 章 ”递归 式 


在 第 一 章 中 我 们 已 经 知道 ， 当 一 个 竺 法 含有 对 其 占 身 的 调用 时 ， 其 运行 时 间 常 常 可 以 用 
递归 式 来 表 未 。 遂 旭 式 是 -组 方程 或 不 等 式 ， 它 所 描述 的 图 数量 用 在 更 小 的 输入 下 该 丽 数 的 
值 来 定义 的 。 傅 姑 ， 在 第 一 章 中 MERGE-SORT 过 程 的 最 本 情 襄 运行 时 间 Tnm) 可 由 下 面 的 

已 (1) 省 n= 1 


工 m 一 人 2T(ny)+em 若 n> 1 4 


其 解 为 TIm 一 日 (二 D。 

本 章 介绍 三 种 解 递归 式 的 方法 一 一 即 找 出 解 的 渐 近 "人 ?或 “7 界 的 方法 。 在 替换 方法 中 ， 
我 们 先 猜 有 某 个 办 存在 , 然后 再 用 数学 归纳 法 证 明 。 枯 代 方 法 是 将 一 递归 式 转 换 成 一 个 和 式 ， 
再 利用 对 和 式 限 界 的 一 一 坚 技 术 米 最 稚 解 弟 月 式 。 主 方法 给 出 了 如 下 形式 的 迷 归 式 的 界 ， 

T( oj=aTony b)+Rn) 
其 中 a>1 pb>1,Rm 是 个 给 定 药 靖 数 。 这 种 方法 要 记忆 三 种 情况 ; 但 - 一 且 做 到 了 这 点 ， 确 定 
很 多 简单 递 妇 式 的 界 就 很 穿 易 了 。 

在 实际 中 ， 我 们 在 表达 和 解 递 归 式 时 常常 略 去 一 紫 技 术 性 细节 ， 一 个 很 好 的 例子 是 常常 
假设 函数 的 身 变 量 为 整数 。 通 常 一 个 算法 的 运行 时 间 T(m 在 定义 时 都 假定 n 为 整数 ， 因 为 
对 大 狗 数 算法 来 说 输入 的 规模 都 是 整数 。 例如 ， 表 达 MERGEB-SORT 运行 时 间 的 递归 式 实 
际 上 应 该 是 

如 (1) 若 n=1 


Ta 四 一 {( rm? 上 +TU 7 2 十 心 (中 ) 荐 n> 1 (42) 


我 们 常常 忽 轿 的 另 一 类 网 节 是 边 恰 六 件 。 本 为 对 固定 规模 的 输 人 来 说 算法 的 这 行 时 加 为 
和 营 量 ， 页 对 足够 小 的 aa 来 说 表示 算法 运行 时 间 的 递归 式 有 Toj= GD。 据 此 ， 为 了 方便 起 
见 我 们 就 常 忽 略 掉 递 扫 式 的 边界 条 件 ， 并 假定 对 小 的 na 值 TOm) 是 个 常量 。 例 如 ， 我 们 一 般 
将 递 扫 式 (4.10 表 达成 

TD=2TO72Hem 苹 (4.3) 

而 并 在 明确 给 出 当 m 很 汪 时 To 的 值 。 原因 是 这 样 的 : 虽然 改 变 TU) 的 值 会 改变 递 上 时 式 的 
解 ， 但 改变 的 只 是 一 个 常数 因子 ， 因 而 增长 的 阶 没 有 变 ， 
”我 们 在 表述 并 解 递归 式 时 ， 常 忽略 底 、 顶 以 及 边界 条 侍 ， 即 在 分 析 蛙 先 忽 略 这 些 细节 ， 
而 后 再 回头 检查 它们 的 作用 。 它 们 对 结果 通常 没有 影响 ， 但 在 它们 确实 发 生 作 用 时 ， 我 们 也 
要 能 知道 。 在 本 章 中 ， 我 们 将 讨论 这 些 细节 ， 从 面 说 明 递 归 式 的 解法 中 的 纲 微 之 处 。 


4.1 替换 方法 


这 种 方法 的 思想 是 先 猜测 解 的 形式 ， 再 用 数学 归纳 法 来 找 出 使 解 俱 正 有 效 的 常数 。 这 种 
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方法 的 名 称 来 自在 作 归纳 假设 时 用 所 猜测 的 解 来 替换 递归 式 中 的 函数 。 这 个 方法 很 有 效 ， 但 
只 能 用 于 解 的 形式 很 容易 猜 的 情形 , 

替换 方法 可 用 来 确定 一 个 递归 式 的 上 界 或 下 界 。 作 为 例子 ， 让 我 们 看 看 下 式 的 上 界 : 

TI 由 =2T(CILn7 2 )Hn 二 (4.4) 

这 个 式 子 与 递归 式 (4.2》 和 (4.3) 很 类 似 ， 我 们 猜 其 解 为 TO = Oa ga 我 们 的 方法 是 证 
明 TInjsscn 1pDn， 其 中 gc>0 是 某 个 常数 。 先 假设 这 个 界 对 1 ny72 成 立 ， 即 TILnxy23 } 
<clinv2j lg 人 (ln 2 )。 

对 递归 式 作 替 换 ， 得 : 


TOnj<s2fcL av72j lg(Ln7 2 力 Fn 
一 Cnleg ny 2)+n 
一 Cn in 一 cn lg 2Hn 
一 台 生 ] 售 蜂 一 CH 十 竹 


< 和 cnlga 


最 后 一 步 在 cz>1 时 成 立 ， 

接 下 来 应 用 数学 妇 绷 法 就 要 求解 对 边界 条 件 成 立 ， 即 要 证 明 能 够 选择 足够 大 的 常数 c， 
使 界 TInj<scn lgn 也 对 边 署 条件 成 立 。 这 个 要 求 有 时 会 导致 一 些 问题 。 假 设 T(D)= 1 是 递 
归 式 的 唯一 的 边界 条 件 ， 则 我 们 就 无 法 选 足够 大 的 c， 因 为 TU)<scl lg 1=0。 

.这 个 困难 很 容易 解决 。 我 们 利用 这 样 一 个 事实 : 渐 近 记号 只 要 求证 明 对 n>>pno，TO)]< 
cn 1g Dn，Do 是 个 常数 。 这 样 居 的 思想 是 在 归纳 证 明 中 对 困难 的 边界 条 件 TD)= 1 不 加 考虑 ， 
并 把 mn=2 和 mn=3 作 为 证 明 中 的 边界 条 件 。 我 们 可 以 把 TC) 和 TO3) 作 为 归纳 证 明 中 的 边界 
条 件 ， 这 是 因为 对 nm>3， 递 归 不 直接 依 霹 T(D)。 由 递归 式 可 得 TI2)=4，T3)= 5。 这 样 ， 
在 归纳 证 明 TInscn lgn， 其 中 常量 c>2 时 ， 只 要 选择 足 铝 大 的 < 使 Tec21g2 及 TG) 
<c3ig3 即 可 完成 证 明 。 实 际 上 ， 和 在 何 c>>2 都 可 满足 这 个 要 求 。 对 我 们 将 要 讨论 的 大 部 分 
递归 式 ， 可 以 直接 扩展 边界 条 件 ， 使 递归 假设 对 很 小 的 mn 也 成 立 。 


. 作 一 个 好 的 猜测 


不 幸 的 是 ， 并 不 存在 通用 的 方法 来 猜测 递归 式 的 正确 解 。 这 种 狂 测 需要 经 验 ， 有 时 甚至 
是 创造 性 。 值 得 庆幸 的 是 ， 还 有 一 些 启发 式 知识 来 帮助 猜测 ， 

如 果 某 个 递归 式 与 读者 先前 见 过 的 类 似 ， 则 可 猪 测 该 递归 式 有 个 类 似 的 解 ， 例如 ， 递归 
式 
. TI 一 2TCL ny 2 +17Ha 
看 起 来 较 难 解 ， 因 为 右 式 工 的 自 变量 中 加 了 !17。 我 们 的 直觉 是 这 个 多 出 来 的 项 对 解 的 影响 
可 能 不 大 。 当 mn 很 大 时 ，T(E n7Z24 )TCI na/ 2 +17) 之 间 的 差别 却 不 很 大 : 差不多 都 将 
a 分 为 均匀 的 两 半 。 因而 ， 我 们 薄 TO)= OO 1 加 这 个 结论 可 用 替换 方法 来 验证 ( 见 练习 
4.1--$)。 
猜测 答案 的 另 一 种 方法 是 先 证 出 递归 式 药 较 松 的 上 下 界 ， 然 后 再 缩小 不 确定 性 。 例 如 ， 
对 递归 式 (4.0)， 可 以 先 假 设 其 下 界 为 TIm= RDm， 因 为 递归 式 中 有 然后 我 们 可 以 证 其 初 
始 上 界 为 TIm=Oa]， 并 逐步 降低 其 上 界 ， 提 高 其 下 界 ， 直 到 达到 正确 的 渐 近 界 
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一 些 细 微 问题 


有 时 我 们 或 许 能 够 猜 出 递归 式 解 的 正确 渐 近 界 ， 但 却 会 在 归纳 证 明 时 出 现 一 些 问题 。 通 
和 党 来 说 ， 问 题 出 在 归纳 假设 不 够 强 ， 无 法 证 明 其 准确 的 界 。 遇 到 这 种 情况 时 ， 可 以 通过 去 挥 
一 个 低 阶 项 来 修改 所 猜 的 需 。 1 

考虑 下 面 的 递归 式 ; 

TD=TLIn72J )HT ra72 1 

我 们 猜测 其 解 是 On)， 即 要 证 明 对 适当 选择 的 ce 有 Tscn。 用 所 猜测 的 界 对 递归 

式 作 替换 ， 得 
.TInjs<cl ny 2 +c rayza 1+1 
一 Cn 十 | 

由 此 引 不 出 Tao)<<cn， 无 论 c 为 何 值 。 读 者 可 能 会 猜 一 个 更 大 的 界 ， 如 TO)= Don )， 
看 起 来 这 个 异 能 满足 要 求 ， 但 实际 上 上， 我们 的 第 一 个 猜测 Tlm= 吕 (中 是 正确 的 。 为 了 证 明 
这 点 ， 要 做 一 个 更 强 的 归纳 假设 . 

从 直觉 上 说 ， 我 们 的 猜测 见 乎 是 正确 的 : 只 是 差 了 一 个 常数 1， 即 一 个 低 阶 项 。 但 就 因 
为 差 了 一 项 ， 数 学 归纳 法 就 无 法 证 出 期 望 的 结果 。 我 们 从 所 作 的 猜测 中 减 去 一 个 低 阶 项 ， 即 
TInsvcnb，b>0 是 个 常数 。 现 在 有 ， 

TOnj<tel ny2 一 brHec Fn72 1-bjti 
三 Cn 一 2b+1 
<cn-b 
在 b>>0 时 成 立 。 像 先前 一 样 ，c 要 选 得 足 驶 大 ， 以 便 能 够 处 理 边界 情况 。 

不 少 人 都 会 觉得 从 所 作 的 猜测 中 减 去 一 项 有 点 与 直觉 不 符 。 为 什么 不 增加 一 个 项 呢 ? 关 
键 在 于 要 理解 我 们 是 在 用 数学 归纳 法 : 通过 对 更 小 的 值 作 更 强 的 候 设 ， 就 可 以 证 明 对 某 个 给 
定 值 的 更 强 的 结论 。 


避 揭 陷 井 


在 运用 渐 近 表示 时 很 容易 出 错 . 例如 ， 在 递归 式 (4.4)》 中 ， 由 于 假设 T(nj<<en， 并 证 明 
Thn)<s2tci ht 2 )Hn 地 
<<cnHn 
一 On 错 了 
因而 错误 地 证 明了 T(m = om)-. 错误 在 于 我 们 没有 证 明 归纳 假设 的 准确 形式 ， 即 TUm< 


cn 。 
改变 变量 


有 时 ， 对 一 个 陌生 的 递归 式 作 一 些 简单 的 代数 变换 就 会 使 之 变 成 读者 较 热 悉 的 形式 . 作 
为 一 个 例子 ， 考 虑 递归 式 
TD=2T(UVni )+lgna 

这 个 式 子 看 起 来 较 难 ， 但 可 以 对 它 进 行 简化 ， 方法 是 改动 变量 。 为 方便 起 见 ， 不 考虑 数 
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的 截取 成 整数 问题 。 设 im= hn， 得 
T(2]=2TCm HHm 
再 做 改名 Sm =T(2m) 就 得 到 新 的 递归 式 
Sm=2SGmny 2Hm 
这 个 式 子 看 起 米 与 (4.4) 就 非常 娩 了 ， 因而 它 的 解 为. St 一 (tm lg m) 
再 从 Stm) 改 回 TIn)， 有 TD=T2o=Sm=Omlgm=oOligntgktzgnm) 


4.2 选 代 方法 


这 种 方法 无 需 对 解 作 狂 测 ， 但 比 替 换 方法 要 做 更 多 的 数学 运算 。 其 思想 是 扩展 (重复 ) 佣 
归 式 ， 并 将 其 表示 为 只 依赖 于 4 与 初始 条 件 的 各 项 的 和 。 热 后 可 用 对 和 式 求 值 的 技 术 来 给 
出 解 的 异 。 

例如 ， 对 正面 的 递归 式 

T(W=3TCL n/44 )He 
”对 其 作 枕 代 如 下 : 
TD=n+3Tt nd ) 
一 mn+3(1 na7 4 +3TCIn716J 
=0n+3(L na/4} +3CLn7H6| +3TLLn7 64 塘 
一 n+3lnv4J +9ln7i6 +27T0In7641 ) 
其 中 
1Ln4J “4j =[Invli6j 与 1 n7 16] “4 二 人 了 7 押 | 
可 从 等 式 ( 人 2. 名 得 出 。 

在 法 到 边界 条 件 之 前 究竟 要 对 递归 式 作 几 次 迭代 ?该 级 数 中 的 第 i 项 是 34 ny4J。 当 

Lnyv4j =1 或 等 价 地 ， 当 i 超过 log4n 时 ，n=1。 当 选 代 进 行 到 这 一 步 并 确定 界 为 


L nz4j <nay4 时 ， 就 能 看 到 和 式 中 包含 了 一 个 下 降 的 几何 级 数 ; 
Top) 和 n+3nv4+9ny716+27n764+… 十 3 加 (1 


委 之 (2) 十 @n“e ) 
= 一 4nf+otnm) 本 
= 一 O(D) 
这 里 ， 我 们 用 了 等 式 (2.9) 来 得 出 3ww” = ,nise， 并 根据 log,3 < 1 得 出 Ba) = on]: 
迭代 方法 奉 涉 到 很 多 的 代数 运算 ， 要 保证 每 一 步 都 正确 很 不 容易 。 要 点 在 两 个 参数 上 : 
在 达到 边界 条 件 前 的 选 代 次 数 ， 选 代 过 程 的 每 一 层 中 各 项 的 和 。 有 时 ， 在 选 代 过 程 中 就 可 个 
计 出 解 的 形式 来 .这 时 就 可 放弃 迭代 方法 ， 而 采用 替换 方法 继续 下 面 的 工作 ， 这 样 可 以 减少 
很 多 代数 运算 
当 遂 归 式 含有 项 函数 和 底 函 数 时 ， 牵 涉 到 的 数学 运算 就 会 变 得 很 复杂 。 这 种 情况 下 可 候 
设 递归 式 仅 定义 在 数 的 整数 次 赛 上 。 在 我 们 的 例子 中 ， 如 果 我 们 假设 了 n= 4 为 整数 ， 
则 就 可 很 方便 地 酷 去 底 函 数 了 。 不 幸 的 是 ， 仅 对 4 的 整数 畴 证 明 T(m)= Oo) 从 技术 上 说 是 
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不 行 的 。 渐 近 记 号 的 定义 要 求证 明 界 对 所 有 足够 大 的 整数 成 立 ， 而 不 仅仅 是 对 4 的 军 成 立 。 
在 4.3 节 可 以 看 到 ， 对 一 大 类 递归 式 ， 这 个 问题 是 可 以 被 解决 的 。 问 题 4 -5 中 也 给 出 了 有 关 
的 条 件 . 


递归 树 


从 递归 树 可 以 形 像 地 看 出 递归 式 的 选 代 过 程 ， 还 可 记录 下 其 中 所 用 到 的 代数 运算 。 这 在 
一 个 递归 式 是 描述 分 治 算法 时 特别 有 用 ， 图 4.1 显示 了 对 应 下 式 的 递归 树 的 导出 过 程 : 


TD=2TO 7 2 
Fr 2 四 
也 AN 

目 四 


/RN /、 


(gw () (Ge “ 


LN ALA 


芋 
人 总 牙 ef， 】 


圈 4.1 与 递归 式 TIn) =2TGa72) + 对 诺 的 一 模 递 归 树 的 构造 过 程 ， 


为 了 方便 ， 假 设 n 是 .2 的 整数 寡 。 该 图 的 (9) 部 分 是 Ttn)， 在 人 b) 中 扩充 成 表示 该 递归 式 
的 一 标 树 。- 项 是 树 根 (递归 顶 晨 的 代价 )， 根 的 两 棵 子 树 对 应 两 个 较 小 的 递归 式 Ta 2。 
(c) 部 分 又 对 Ta 7 2 进一步 扩展 。 递 归 的 第 二 晨 上 的 两 个 节点 的 代价 各 为 On 7 2 六 。 继 续 这 个 
书展 过 程 ， 直 到 达到 边界 条 件 。{d) 图 中 是 最 终 的 树 ， 高 度 为 lgn (共有 lgn+i 层 ). 

现在 就 可 以 通过 将 辆 中 每 层 的 值 加 起 来 而 求 递归 式 的 值 。 顶 层 各 值 的 和 为 岂 ， 第 二 层 
的 为 my 2)2+Hny 22=n22， 第 三 层 有 值 ny 47+ny7 02Hny 42Hny 42=m274， 等 等 。 
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各 层 的 民 呈 几何 下 降 ， 因 而 总 和 至 多 是 最 大 值 的 常数 悦 ， 即 解 是 @n2]。 
4.2 给 出 了 另 一 个 更 复 驼 的 例子 ， 即 对 应 于 式 的 递归 树 : 
Tu 一 Ta 3iHTC2n7 3Hn 
(此 处 为 简单 起 见 还 是 略 去 了 底 函 数 和 项 函数 。) 在 将 递归 树 各 层 的 值 加 起 来 时 ， 发 现 每 
一 层 的 值 都 为 n。 从 根 到 叶 的 最 长 的 一 条 路 径 是 ht>(273)nr(C27 3 一 …->1。 因 为 当 
上 =log yn 时 ，(2737n=1， 该 树 的 高 度 为 1jog:,，2n0。 因 而 ， 该 递归 式 的 解 至 多 是 


nlog3 ，a 一 On 1 站 )。 


总 共 已 二 这 疗 ) 
图 4.2 与 递归 式 To) = Toy3) HTCny3] +m 对 应 的 一 棵 递归 竺 


4.3 主 方法 


主 方法 {the master method) 用 于 解 如 下 形式 的 递归 式 
TIm=aTny bfn) (4.5) 

其 中 az>1 和 b>l 是 常数 ，flo 是 一 个 渐 近 正 的 阔 数 。 主 方法 要 求 记忆 三 种 情况 ， 但 这 样 可 
很 容易 地 确定 许多 遂 归 式 的 解 ， 且 不 要 用 纸 和 笔 。 

递归 式 (4.5) 描 述 了 将 规模 为 mn 的 问题 划分 为 a 个 子 问题 的 算法 的 运行 时 间 ， 每 个 子 问题 
规模 为 ny b，a 和 b 是 正常 数 。a 个 池 问 题 被 分 别 递 归 地 解决 ， 时 间 各 为 Tln y b)。 划 分 原 
问题 和 合并 答案 的 代价 由 苯 数 fo) 撒 述 。( 即 使 用 1.3.2 节 中 的 记号 ，fn)=DInyHcn)。 例 
如 ，MRERGE-SORT 过 程 中 的 递归 式 中 有 a=2，hb=2，Rm 一 @(n)， 

从 技术 正确 性 角度 看 ， 递 归 式 实际 上 没有 得 到 很 好 的 定义 ， 因 为 nb 可 能 不 是 个 整 
数 。 但 用 TIa~bJ ) 或 Tryvb 1) 来 代替 a 项 Tvb) 并 不 影响 递归 式 的 渐 近 行为 (我 们 
将 在 下 节 中 对 此 证 明 )。 因 而 ， 我 们 在 写 分 治 算法 时 略 去 项 和 底 画 数 会 带 来 很 大 方便 。 


主 定 理 


主 方法 依赖 于 下 面 的 定理 : 
定理 4.1! 主 定理 ) 设 a>>I 和 b>1 为 常数 ， 设 Ton) 为 一 函数 ，TGn) 由 下 面 递归 式 定义 
To 一 afTnybHn) 
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nxzh 指 [nxbl 或 mxhb lj 则 TOm 可 有 如 下 的 渐 近 界 : 
1. 若 对 某 常 数 E > 0， 有 fm = Da 和 ) 则 TO = @(ns")。 


2 若 fm)= Bon  )， 则 To) = Ba lgn)。 


3. 若 对 某 常 量 e > 0， 有 fftnp) = Rn 扣 *…)， 且 对 常量 c< 1 与 所 有 足够 大 的 ， 
有 afnyb)scfn， 则 TI 一 加 (人 fn))。 

在 运用 该 定理 之 前 ， 先 让 我 们 来 看 看 它 包含 哪 些 内 容 ， 在 以 上 三 种 情况 的 每 一 种 中 ， 我 
们 都 把 画 数 ftn) 与 攻 数 n 拉 " 进行 比较 。 我 们 的 直觉 是 解 由 两 个 画 数 中 较 大 的 一 个 决定 。 例 
如 在 第 一 种 情况 中 ， 函 数 n 全 "更 大 ， 则 解 为 TDJ= @tnee")。 在 第 三 种 情况 下 ，fn) 是 较 大 
的 函数 ， 则 解 为 TO= (fto)。 在 第 二 种 情况 中 ， 两 种 旬 数 同样 大 ， 则 解 为 TCD)= 
Ganee lg) 一 (fn) 地 Di 

这 只 是 我 们 的 直觉 ， 另 外 还 有 一 些 技术 问题 要 加 以 理解 . 在 第 一 种 情况 中 ， 不 仅 要 有 
fm) 小 于 ns* ， 还 必须 是 多 项 式 地 小 于 ， 即 对 某 个 常 重 6 > 0，fm) 必 须 渐 近 地 小 于 nm ， 
两 者 差 一 个 因子 nE 。 在 第 三 种 情况 中 ，ffn) 不 仅 要 大 于 n "%" ， 且 机 多 项 式 地 大 于 ， 还 要 满 
足 条 件 aftn / bj<cftn)。 我们 后 面 将 磁 到 的 大 部 分 多 项 式 有 界 的 函数 都 满足 这 个 条 件 。 

要 注意 三 种 情况 并 没有 覆盖 所 有 可 能 的 fm)。 当 fm 只 是 小 于 n "但 不 是 多 项 式 地 小 于 
时 ， 在 第 一 种 情况 和 第 二 种 情况 之 间 就 存在 一 条 *“ 沟 "。 类 似 情况 下 ， 第 二 种 情况 和 第 三 种 情 
况 之 间 也 会 存在 一 条 “ 沟 "。 如 果 ftn) 落 在 任 一 条 沟 中 ， 或 者 第 三 种 情况 中 的 条 件 不 成 立 ， 则 
主 方法 就 不 能 用 来 解 递归 式 。 


主 方法 的 应 用 


在 放 用 此 方法 时 ， 先决 定 要 选取 定理 中 的 哪 _ 一 种 情况 ， 然 而 即 可 简单 地 写 下 答案 先 看 
第 一 个 例子 : 
TOm=9Tn 7 3Hn 
在 这 个 递归 式 中 ，a=9，b=3，gm=m， 则 no” 一 noe? = Bo2)。 因 为 Km)= 
On 池 “)， 其 中 6E =1， 这 对 应 于 主 定理 中 的 第 一 种 情况 ， 答 案 为 TD)= @(o).. 
”再 看 一 个 例子 : TD=TCny 3)+Hl 
其 中 a=I，b=37 2，fm=1 ns =ne =n=1， 第 二 种 情况 成 立 ， 因 为 
fo)=G@n ee ) 一 @(D) 故 递归 式 的 解 为 To)=@(1e my)。 
对 递归 式 To=3Tny HHn lg n， 有 a=3，b=4，frny=ma ] 信 m，m eg 一 丰 全 
9 因为 Rao)=Qn  “)， 其 中 E s0.2， 如 果 能 证 明 对 ftn) 第 三 种 情况 中 的 条 件 
， 则 选用 定理 中 的 第 三 种 情况 。 对 足够 大 的 hn，afnyvb)=3nx 有 区 ny74inte 
ay c=374， 则 递 扫 式 的 解 为 TIn)= 9 
对 下 面 的 递归 式 主 方法 不 适用 : 
T(m=2T(ny 2rHHnleDn 
这 个 递归 式 的 形状 看 上 去 是 合适 的 : a= 2，b=2，fn)=nlgn，new 一 n。 看 上 去 可 选 
择 第 三 种 情况 ， 因 为 Rm=natgn 痢 近 大 于 ns" =nh， 但 并 不 是 多 项 式 大 于 。 对 任意 正常 数 
E《， 比 值 fo)yne" =nlgnn= lgna 渐 近 小 于 ne。 因 此 ， 该 递归 式 落 在 情况 二 与 情况 ， 
三 之 间 。( 练 习 4.4-2 给 出 解答 ) 


> 44 主 定理 的 证 明 


本 节 为 程度 较 高 的 读者 给 出 了 主 定理 的 证 明 。 

证 明 分 为 两 部 分 。 第 一 部 分 分 析 *“ 主 "递归 式 (4.3)， 并 作 了 简化 假设 T(n) 仅 定义 在 b>1 
的 整数 短 上 ， 即 n= 1，b，b*，…。 这 部 分 从 直觉 上 说 明 该 定理 为 何 正确 。 第 二 部 分 说 明 如 
何 将 分 析 扩 展 对 所 有 正 整 数 n 成 立 ， 主 要 是 应 用 数学 技巧 来 解决 底 函 数 和 顶 冰 数 的 处 理 问 
题 . 

本 节 中 ， 我 们 将 用 渐 近 记号 来 描述 定义 在 b 的 整数 知 上 的 函数 的 性 态 。 这 是 有 点 " 活 
用 " 几 近 记号 了 。 回 忆 一 下 , 渐 近 记号 的 定义 要 求证 明 界 对 足够 大 的 数 成 立 。 而 不 仅仅 是 对 
b 的 袁 成 立 。 风 为 我 们 可 以 构造 出 适用 于 集合 {fbi= 0,1…}( 而 不 是 非 负 整数 ) 上 的 汤 近 记 
号 ， 故 这 种 “活用 "是 没有 关系 的 。 

要 注意 当 在 一 个 有 限 域 上 运用 渐 近 记号 时 ， 不 能 引出 不 合适 的 结论 。 例 如 ， 证 明了 当 n 
是 2 的 整数 敌 时 ，TCn) = On) 成 立 不 能 保证 TO) OG@ 对 所 有 成 立 。 函 数 TOn) 可 定义 成 


nm 一 1，2，1， 
_Tm = { 知 则 


可 科 和 的 最 人 区 本 是 TO-oga， 与 TO LOU 和 是 人大 本 而 到 
有 限 域 上 用 渐 近 记 号 时 一定 要 在 上 下 文中 说 清楚 . 


4.4.1 取 台 数 秋 时 的 证 了 明 


主 定 理 证 明 的 第 一 部 分 是 分 析 递 归 式 (4.5) 
Tm=aTay b+fto) 
此 时 的 假 谨 是 mn 为 b>1l 的 整数 释 ， 且 b 不 必 是 整数 。 分 析 可 分 成 三 个 引 理 来 说 明 。 第 
一 个 引 理 是 将 解 原 递归 式 的 问题 时 约 为 对 一 个 含 和 式 的 表达 式 求 值 的 问题 。 第 二 个 引 理 决定 
该 和 式 的 界 。 第 三 个 引 理 把 前 两 个 合 在 一 起 和 证 明 当 mn 为 b 的 整数 宕 时 主 定理 成 立 。 
引 理 4.2 设 a>>1，b>1l 为 常数 ，ftn) 为 定义 在 b 的 整数 填 上 的 函数 。 定 义 Tm 如 
下 : 
Ta -20 若 n = 1 
aTLny bl) +fn) . 戎 n=b 
其 中 是正 整 数 。 则 有 


OoEbm 一 上 


TO =- exes+ 开 amyb 5 


证 明 : 对 该 递归 式 选 代 ， 得 
TO 一 fn) 十 aTny by 
一 fo + affn yb) 十 a TIn V b 
一 ft+tafnyxyt+a Rnxb 二 " 
十 aegn fn ybomo 二 acsnT(1) 
因为 a 所 ”= not" ， 利 用 边界 条 件 T(1) = @(TD) 可 知 ， 上 式 的 最 后 一 项 为 


a onT(1) 一 四 (ne ) 
余下 的 各 项 可 表示 为 和 


了 本 一 | 


， aiftn yb ) 


i 


因而 


Tn) = Btn 十 afnvb) 
证 毕 . 
递归 树 


我 们 先 用 一 标 递 归 树 来 得 出 一 些 直 觉 结 论 。 图 4.3 给 出 了 对 应 引 理 4.2 中 递归 式 迭 代 过 
程 的 树 。 这 是 一 棵 完全 a-- 叉 树 ， 共 有 nm 中 "个 时 节点 ， 高 度 为 logua。 每 一 层 的 代价 示 于 右 
边 ， 各 层 代价 之 和 由 方程 〔4.6) .给 出 。 根 节点 的 代价 为 fm， 它 有 a 个 子女 ， 每 个 的 代价 
为 fn / j。( 为 方便 起 见 可 将 a 视 为 整数 ， 但 这 对 数学 推导 没有 什么 影响 。) 每 个 子女 又 各 
有 a 个 子女 ， 代 价 为 fn / 的 。 这样 就 有 a2 个 节点 离 根 的 臣 离 为 2， 一般 地 ， 了 下 根 为 j 的 节 
点 有 下 个 ， 每 一 个 的 代价 为 fn b)。 每 一 个 叶 节 点 的 代价 为 TO)= B(D)， 每 一 个 都 距 根 
login， 因 为 ay b "ee" = 1。 树 中 共有 ae "= Ge 个 时节 点 。 





成才 


-ri 





jp Fi Fa) 一- 和 070al) 





2 更 


多 Fa 本 A 2 六、 次 这 re ) 多 ) 
如 洛 如 f 放 


人 二 睛 六 | 和 了 放 本 证 和 面 
上 和 站 于 和 和 


二 - 
el elD ed) eD et) etD etD enD e0) e0) enD el)>w ee 人 
1 和 二 . 一 一 
电 ， jos me 一 
间 共 e(o 人 + oro 
四 
图 43 由 T 人 mn =aT tyh) +tf (nj) 所 产生 的 递归 树 


我 们 可 以 将 树 中 各 层 上 的 代价 加 起 来 而 得 到 方程 (4.6)。 第 j 层 上 内 节点 的 代价 为 
afgmy 区， 故 所 有 各 层 内 节点 代价 和 为 


一 43 一 


可 lgin=1 


放 ， aiffn /bji) 


在 其 所 基于 的 分 治 算法 中 ， 这 个 和 值 表示 了 将 同 题 分 解 成 子 问题 并 将 子 问题 的 解 合并 
时 所 花 的 代价 。 所 有 时 子 欧 代价 ( 即 解 ao" 个 规模 为 1 的 子 问题 的 代价 )》 为 @(n ”)。 
根据 递归 树 ， 主 定理 的 三 种 情况 对 应 于 树 中 总 代价 的 三 种 情况 : (1) 由 所 有 叶 节 点 的 代 
价 决定 ;人 2) 均 匀 地 分 布 在 各 层 上 ;(3) 由 根 节点 的 代价 决定 。 
方程 (4. 昌 中 的 和 式 表示 了 分 治 算法 中 分 解 和 合并 步骤 的 代价 。 下 一 个 吉 理 给 出 了 该 和 式 
的 放 近 界 。 . 
引 理 4.3 设 a>>1，b> 1 为 常数 ，fm) 为 定义 在 b 的 整数 者 上 的 非 负 函数 。 画 数 gtn) 由 
下 式 定义 四 
gfnJ 一 》， aiftn yb (4. 力 


总 
该 函数 可 被 浙 近 限界 为 
1 若 对 常数 e > 0， 有 fn) = OUnps* “)， 则 go) = Onyw*)， 
2. 若 ftn) = nm )， 则 g(n) = Ga lgm。 
3. 若 对 常数 c < 1 及 所 有 的 na 基 b，afltn yb) 和 cfm， 出 g(n) = edm)， 
证 明 : 对 情况 1， 有 fto) = On we* “)， 这 隆 含 着 fn yb) = O(nvyb ) so “)。 用 它 对 
方程 (4.7) 作 代 换 ， 得 四 


Jen 一 上 


sm-of Y jj 全 logva 一 )) _。 (4.8) 


- j 斑 


对 @ 一 记号 内 的 式 子 限界 ， 方 法 是 提出 不 变 项 并 作 简 化 ， 得 一 上 升 几何 级 数 : 
Iegla 一 1 loeun 一 | 已 j 
3 8 人 ab-: ea 一 iegoe 》 ( ab 二 


] OBE，BR 
j- -im0 Ab ， 





一 1 


一 pear 


]=0 


Le -1 

攻 一 1 

_ am 人 (2 
忆 一 1 


因为 与 < 都 是 常数 ， 最 后 的 表达 式 可 化 简 为 n ”OO ) 一 Oftnem”")。 用 此 表达 式 对 方 
程 (4.8) 作 替换 , 得 
gm) 一 On oa 
情况 1 得 证 . 


为 证 情况 2， 候 设 Kn) = ea) 有 fayb]= -edavb) 人 用 此 式 对 方程 (4 7 
作 蔡 换 ， 福 


sm-el 工 全)”) (4 细 


对 加 - 记 叶 中 的 式 子 作 类 似 情 况 工 中 的 限界 ， 但 所 得 并 非 一 几何 级 数 ， 而 是 每 项 都 是 相 


同 的 : 
bm 一 1 _ logla 了 一 
包 bb j= bo。 


Ion 一 1 


一 nm [fogu aa > { 


一 ee” ljog nmn 
用 此 式 对 方程 (4. 9) 中 的 和 式 作 蔡 换 ， 有 
zfn) 一 Bl “log ,D) 


一 四 (n "lgb) 
则 情况 2 得 证 . 
”情况 3 也 可 作 类 似 的 证 明 。 因为 fa) 在 g(m) 的 定义 式 (4.7 中 出 现 ， 且 ga) 的 所 有 项 都 是 
非 仙 的 ， 可 以 得 出 gt=Rfn) 对 b 的 整数 宪 成 立 。 假 设 对 常数 c<1 和 所 有 nZhb， 
aftnZ bj<scftn)， 有 afmayvb)<ciftm。 用 此 式 对 方程 (4.7) 作 替换 并 化 简 ， 可 得 一 几何 级 数 。 
与 情况 1 不 同 的 是 ， _ 这 个 级 数 是 下 降 的 。 
gan) 乏 入 afonyb) 


jw 
二 ob 一 1 


-所 cfn) 


j 一 了 


所 信 D) 允 C 


了 一 侨 


一) (Te 


= 一 Ofn)) (为 常量 ) 
如 此 可 得 对 bb 的 整数 午 ， 有 gtn)= Bftno)。 情 况 3 得 证 。 整 个 盾 理 证 明 完 毕 ， 
现在 就 可 证 在 n 为 b 的 整数 每 时 的 主 定理 成 立 。 
” 引 理 44 设 a>1，b>1 是 常量 ，fln) 是 定义 在 b 的 整数 老 上 的 非 负 二 数 .定义 TUn) 
如 下 : 





人 (1 共 n= 1 
TO) = 机 
anyhb) 二 Rn) 若 一 刷 
其 中 渴 正 整数 。TOD) 可 有 如 下 渐 近 界 : 
1. 若 Rn) = Onose )，E > 0， 则 TU) 一 包 ne ) 
2. 若 ftn) = @tn os)， 则 Tn) = @noeslgn) 
3. 车 fn) = ntn ee"“)，E >0。 且 车 对 常数 c< 1 和 所 有 足够 大 的 mn，af(n / p) 


-一 45 一 


< cfm， 则 TOm=@dnhn。 
证 明 : 用 引 理 4.3 中 给 出 的 界 来 对 引 理 4.2 中 和 式 (4.6) 求 值 。 对 情况 1， 有 
T( 一 昌 neoe) 十 On om") 


一 回 (neoee 
对 情况 2， 有 
TI(m = 四 (ne 十 四 (ne lgm) 
一 四 (ne "lgn) 


对 情况 3， 条 件 afta / b) < cftn) 隐 含 fn) = QGa ””“) 见 练习 4.4 一 3)。 因 而 
TD = Bo) +Gftn) 
= Btfon)) 
4.4.2 ” 底 函 数 和 项 函数 


为 使 主 定理 的 证 明 更 完整 ， 还 要 将 分 析 扩展 到 递归 式 中 含 顶 冰 数 和 底 函 数 的 情形 ， 使 递 
归 式 定义 在 所 有 的 整数 上 ， 而 不 仅仅 是 b 的 整数 宕 。 


对 递归 式 
Ttm=aT( nxyhb TDHfn) 。 人 
给 出 下 界 与 对 递归 式 
To=aT(Taxzbl )H+Pm) (4.1 


给 出 上 界 都 是 很 容易 的 事 ， 因 为 由 界 avyb 1>>ayhb 可 得 情况 1 中 所 需 结 果 ; 界 | ny Hb 
<avb 可 得 情况 2 中 所 需 结 果 。 找 出 (4.11) 的 下 界 与 给 出 (4.10) 的 上 界 需 要 类 似 的 技术 ， 故 
只 给 出 后 一 个 界 。 
像 在 圳 理 4.2 中 一 样 ， 我 们 对 递归 式 (4.10) 作 迭 代 。 在 和 迭代 壕 程 中 ， 得 到 对 自 变 量 的 一 

系列 递归 调用 : 

rnzbh 

fraxzblxb1，. 

rrrnzblxblxbh 

过 


用 mi 来 表示 序列 中 第 i 个 元 素 ， 即 
全 。 著 1 一 0 

ni 一 1 rm vb 1 落 i>0 (4.] 
我 们 的 初步 目标 是 决定 渤 代 的 次 数 《, 使 nk 为 一 常数 。 利 用 不 等 式 fx 1 所 xx 十 1 得 ， 


妇 
于 关 


也， 并 
L b Pb: 
nm， bb 
b- b 一 1 
当 i=[ log ,nj 时 ， 有 ni; 和 b+bvb 一 D=QU. 
对 递归 式 人 4.10) 作 和 迭代 ， 得 
TD 一 fn)+ari) 
一 fn ,) 十 afn ) 十 a TOn ) 


么 fn +afni) 十 a fn ,) 十 … 


十 了 legk nmJ fn， 本 -1 十 al logty Dj T@， os ) 
， Lagual 一 1 
一 Baeme ) 十 己 a ftn ) (4.13) 
上 式 与 方程 (4 6 很 相似 ， 只 是 此 处 n 可 以 是 任意 整数 ， 而 不 限于 b 的 整数 乞 。 ! 
现在 可 根据 (4.13) 对 下 式 求 值 : : 
Lot -1 ， 
gm= 工 afon) (4.14) 


先 看 情况 3， 如 果 对 mn>b+byb 一 D， 有 af rm/b Ts<cfn，c< 1 为 常数 ， 则 
有 a fn)sc fn)。 这 样 ，(4.14) 中 的 和 式 就 可 如 引 理 4.3 一 样 地 求 值 、 对 情况 2， 有 fn) 
= Btnse*)。 如 果 我 们 能 证 明 fn )= On /aa)=O(Un/yb) )， 则 套用 引 理 4.3 中 情 
况 2 的 证 明 即 可 。 注 意 这 时 有 j< 1 logunl 隐 含 着 bi /ns 1， 界 fn) = On ) 降 含 着 存 
在 常数 c> 0， 使 对 足够 大 的 n,， 有 


mn hb ) 
委 51 一 十 一 一 
fj) c 5 











<ol( 2 
3 。 
此 处 cL+byv 人 b - D) "是 个 常数 。 如 此 情况 2 得 证 。 情 况 1 的 证 明 几 乎 一 样 ， 关 键 在 于 


证 明 界 fnij) = On “” )， 这 与 情况 2 中 对 应 部 分 的 证 明 类 做， 但 代数 运算 要 更 复杂 . 
到 这 里 我 们 证 明了 主 定 理 的 上 界 ， 其 下 界 的 证 明 也 类 似 ， 


思考 题 


4-1 诞 归 式 的 例子 


给 出 下 列 递归 式 的 渐 近 上 下 界 。 假 设 To) 是 个 常数 ，n<<2。 使 所 给 出 的 界 尽 量 紧 确 ， 
并 给 出 证 明 。 

38 TI(m)=2Tn 7 2 分 Ha 
b. TOn)=T(9n 7 10jHn 
c._ TI 一 16TO 7 4iHHo 
d. TO) 一 7TIay 3)Ha- 
e. To)=7Tn yy 2)Hn; 
f TOD=2TOo4rVn 
产 ， TH) 一 工 (n 一 Ho 
h、Tm=TCVz)+l 


4-2 找 出 所 缺 的 翌 数 


某 数组 A[1..a] 含 有 所 有 从 0 到 nm 的 整数 ， 但 其 中 有 一 个 整数 不 在 数组 中 。 通 过 利用 一 
个 辅助 数组 B[0.m] 来 记录 A 中 上 出现 的 整数 ， 很 容易 在 On) 时 间 内 找 出 所 缺 的 整数 ， 但 在 这 
个 问题 中 ， 我 们 却 不 能 由 一 个 单一 操作 来 取 接 A 中 的 一 个 完整 整数 ， 因 为 A 中 的 元 索 是 以 
二 进 制 表示 的 。 我 们 所 能 用 的 礁 一 操作 就 是 “ 取 Ai 的 第 j 位 "， 这 个 操作 所 花 时 间 为 常数 。 

证 明 : 如 果 仅 用 此 操作 ， 仍 能 在 O(m 时 间 内 找 出 所 缺 的 整数 。 


4-3 对 数 传递 的 代价 


整个 这 本 书 中 ， 我 们 都 假定 过 程 油 用 中 的 参数 传递 所 花 时 间 为 常数 ， 即 使 所 传递 的 是 个 
有 N 个 元 素 的 数组 也 是 一 样 。 这 个 假设 对 大 多 数 系统 都 是 有 效 的 ， 因 为 当 参 数 为 数组 时 ， 
所 传递 的 只 是 指向 该 数组 的 指针 ， 而 不 是 该 数组 本 身 。 本 问题 讨论 三 种 参数 传递 策略 : 

1 .数组 由 一 个 指针 来 传递 。 时 间 = @()。 

2. 参 数 数组 通过 复制 而 传递 。 时 间 =@(N)，N 是 该 数组 的 大 小 。 

3. 一 个 数组 在 被 传递 时 ， 仅 拷贝 被 调用 过 程 可 能 引用 的 数组 的 子 域 。 若 传递 的 是 子 数组 
A[p..qj， 时 间 = @(p-q+D)。 
” a. 考 虑 在 一 个 已 排序 的 数组 中 找 一 个 数 的 递归 二 分 查找 算法 ( 见 练习 1.3-$。 针 对 上 面 
的 三 种 参数 传递 策略 ， 给 出 最 坏 情 况 运行 时 间 的 递归 式 ， 并 给 出 其 解 的 上 界 ， 可 以 设 N 为 
原 癌 题 的 规模 ，n 为 子 问题 的 规模 。 

b. 重 做 1.3.1 节 中 MERGE-SORT 的 (a) 部 分 . 


一 委 一 


4-4 进一步 的 递归 式 的 例子 


给 出 于 列 递归 式 的 新 近 上 下 界 。 盘 设 对 na 所 2，TO) 是 个 常量 。 使 所 给 出 的 界 尽量 紧 
确 ， 并 加 以 证 明 。 
a- TIm=3TC7 2)+n1lgn 
TO =3T(a/3+5)Hny2 
TO 一 2Tn7 2 itgn 
TD= To-DHa 
To 一 TIn 一 1ytlgn 
TIm=VynTan)+an 


4 一 5 Sioppiness 条 件 


通常 ， 我 们 是 在 b 的 整数 卉 上 对 一 递归 式 To) 限 弄 的 。 本 问题 给 出 足够 的 条 件 且 使 界 
扩展 至 对 所 有 实数 n>0 成 立 。 

a. 设 TIn) 和 h(n) 是 单调 了 递增 函数 ， 并 设 当 n 为 常数 b> 1 的 整数 宏 时 有 Tonj<chGoamDy。 另 
外 ， 设 hm 是 “缓慢 增长 的 "， 即 ht 由 = Ohtn y bj。 证 明 TIn)=Olhn))， 

b. 设 有 递归 式 TO = aTtay b+HRn)， 其 中 az>1，b> 1，ftn) 单 调 递增 。 进 一 步 假 设 该 递 
归 式 的 牢 始 条 件 由 TD= egn，nsno 给 出 ， 其 中 gm 单调 递增 ，gno<<aTnoy b)+ffny)。 
证 明 T(m 是 单调 递增 的 . 

.在 ffa) 为 单调 递增 并 缓慢 增 长 的 情况 下 ， 简 化 主 定理 的 证 明 ， 证 明 中 可 引用 引 理 
4.4。 


mp 


4-6 遇 波 那 契 数 


我 们 已 在 递归 式 (2.13) 中 定义 了 斐 波 那 契 数 ， 现 在 进一步 介绍 它们 的 人 性质。 我们 将 用 生 
成 函数 的 技术 来 角 间 波导 各 递 有 式 。 定 义 生 成 本 数 或 正则 宕 级 数 节 如 下 


Ff(z) 一 之 Fiz z 


一 0+z+ 开 十 2z3 二 3 人 4 十 5z5 十 8z6 十 13z7 十 2178 十 … 
8a. 证 明 :， F(z =z+zFz) 十 2 FF 向 
b. 证 有 明 : 
F@= 一， 
1 一 并 一 
卫 


”G 二 四 (二 区 
= 去 ( 一 天 -一 一 ) 
v5\1 一 经 1 一 产 


-其 中 态 = 1 -16l803… 


所 -一 半 = 一 0.61803… 


心 ， 证 明 : 
FG= 开 -T( 一 仿 )2 


d. 证 明 ,F, = 凶 7/V5， 对 i > 0， 埠 至 最 近 的 整数 。( 担 示 : | 哆 < 1 
e. 证 明 : 下 > 邮 ，iz0。 
4-7 VLSI 芯片 测试 


现 有 ?| 片 被 认为 是 完全 相同 的 VLSI 芯片 ， 产 则 上 它们 可 以 互相 测试 。 测 试 装 辕 一 次 可 
测 二 片 ， 当 该 装置 中 已 放 有 两 片 芯片 时 ， 每 一 片 就 对 另 一 片 作 测试 并 报告 其 好 坏 。 一 个 好 的 
芯片 总 是 能 够 准确 地 报告 另 一 片 的 好 杯 ， 但 一 个 坏 的 芯片 的 结果 是 不 可 靠 的 。 这样、 每 次 测 
试 的 四 种 可 能 结果 如 下 : 


人 入 菩 片 报告 | 巨 茧 片 报告 









了 是 好 的 | A 是 好 的 | 都 是 好 的 ， 或 都 是 坏 的 | 
.| B 是 好 的 |A 是 坏 的 | 至 少 一 片 是 坏 的 | 
| 了 B 是 坏 的 ”|A 是 好 的 | 至 少 一 片 是 坏 的 
入 是 坏 的 

a. 证 明 若 多 于 ay 2 的 芯片 是 坏 的 ， 在 这 种 成 对 测试 方式 下 使 用 任何 策略 都 不 能 确定 哪 
个 世 六 是 好 的 。 

b, 考虑 从 nm 片 中 找 出 一 片 好 的 问题 ， 假 设 多 于 na /2 的 芯片 是 好 的 。 证 明 [ ny 2 对 测 
试 就 足以 使 问题 的 规模 降 至 近 原 来 的 一 半 ， 

c. 假设 和 多 于 ny2 片 昔 片 是 好 的 ， 证 明 好 的 芯片 可 用 @ 人 0) 对 测试 找 出 。 给 出 并 解 表 达 
测试 次 数 的 递归 式 。 


练 习 四 





_。 本 
4.1-1 证 明 T=T(C [ray2 1)+]1 的 解 为 OUIEm。， 
4.1-2 证 明 Tm=2T(Lnv72 tn 的 解 为 人 no 过 四， 
41-3 证 明 ; 通过 作 不 同 的 遵 归 候 设 ， 对 递 殷 式 (人 4.4) 我 们 可 以 克服 在 证 明 边 界 条 件 TD=1I 时 的 困 
难 ， 同 时 无 天 应 整 归纳 证 明 中 的 边界 情况 . 
4.1-4 ”证明 : 合并 排序 算法 的 准确 的 递归 式 导 . 习 的 解 为 @ta 域 D。 
4.1--$ 证 明 Toj=2T(L ny21 +17)Hrn 的 解 为 DO leI。 
”4.1-6 通过 变换 变量 来 解 递归 式 T()=2T(Vna +H1，{ 变 量 的 值 是 否 是 整数 无 关 紧 要 ) 


4.2--] “用 竹 代 方法 确定 递归 式 TIm = 3TLL ny 2 )}Hn 的 一 个 浙 近 上 界 ， 

4.2-2 用 递归 树 来 证 明 递归 式 TIm=Tay7 3HT2n7 3)yHhn 的 解 为 mn lgI。 

4.2-~3 面 出 TIm=4TCL ny21 Han 的 递归 树 ， 并 给 出 其 解 的 紧 确 的 渐 近 界 . 
424 利用 选 代 来 解 TImy= TIn-a)HTayrHhn， 其 中 a2>i 是 个 常量 . 


4.2 一 5 和 用 一 棵 一 站 对 来 解 递 | 7、 Ti=TomnHTCI-onrHn， 其 中 c 是 个 常量 ， 且 0<x<1， 


4.3 一 ! 用 主 方 法 来 给 出 下 列 遂 有 式 守 确 的 芝 弄 : 

a.Tfn)=d4Tn 7 2 

b. TDJ=4Ttn yy 2Hn 

c.T(m= 4Tn /27Hn3 

4.3-2 某 个 算法 A 的 运行 时 间 由 和 遵 归 式 TIm=7Tay 3h+a" 表示 ; 另 一 个 算法 A' 的 运行 时 间 为 
To)=aT(ny 和 Haz。 若 要 A' 比 和 更 快 ， 最 a 的 最 大 整数 值 是 多 少 ? 

4.3-3 用 主 方法 证 明 二 分 查找 Ttm= Tin 7 2HG() 的 解 是 T(m= 呈 (1 器。 

4.3-4 * “ 考 噶 主 定理 情况 3 中 的 条 件 afn ybj<ceftn)，e<1。 给 出 一 个 简单 熏 数 fm) 的 例子 ， 使 之 满 
足 情况 3 中 除 此 之 外 的 条 件 。 


4.4-1+ .在 方程 (4.13 中 ， 若 b 是 个 正 整 数 而 不 是 任意 实数 时 ， 请 给 出 凸 的 一 个 简单 而 准确 的 表达 
式 . 


4.4 二 2* 证 明 ; 车 ffn)=@(noaslg ny)， 其 中 上 > 0， 则 主 定理 中 退 归 式 的 解 为 TCa) 
一 外 (nig ”ia。 为 简单 起 见 ， 可 只 对 b 的 整数 宕 分 析 . 

4.4 一 3 在 主 定理 的 情况 3 中 条 件 af(n / b) < cf(p)，e< 1 隐 会 着 存在 常数 > 0 使 fn) 
= Rn )。 据 此 请 证 明定 理 中 的 陈述 过 强 了 。 


第 五 章 集合 关系 范 数 图 和 树 


前 几 章 中， 我们 接触 了 离散 数学 中 的 一 些 内容 。 本 章 将 回顾 更 多 的 有 关 集合 、 关 系 ， 函 
数 、 图 和 树 的 表示 、 定 义 与 基本 性 质 。 已 熟悉 这 些 内 容 的 读者 稍 加 浏览 即 可 。 


51 集 合 


集合 包含 一 组 可 区 分 的 对 象 ， 称 为 成 员 或 元 素 。 如 果 某 对 象 x 是 一 个 集合 $ 的 成 员 ， 
册 写 xcS。 如 果 x 不 是 S 的 成 员 ， 则 写 雁 $8。 我们 可 以 通过 将 集合 的 全 部 元 素 列 在 括号 内 
的 方法 来 描述 一 个 集合 。 例 如， 可 以 定义 含有 元 素 1，2 和 3 的 集合 为 S$={1，2，3}， 因 为 
2 是 $ 的 成 员 ， 故 可 写 268S; 又 因 4 不 是 3 的 成 员 ， 有 4 往 $S。 一 个 集合 不 能 含有 重复 的 元 
束 ， 且 其 元 素 间 也 是 无 序 的 。 两 个 集合 若 含 有 相同 的 元 素 ， 则 说 它们 是 相等 的 ， 写 作 
A=B。 例 如 ，{!1，2，3，1j=1L，2，3 引 =13，2，1。 

我 们 用 一 些 特别 的 记号 来 表示 经 常 磁 到 的 集合 : 

“由 表示 空 集 ， 即 不 含 任何 成 员 的 集合 。 

“ 民 表 示 整 数 集 ， 即 集合 {…，-2，-1，0，1，2，…)}。 

有 R 表示 实数 集 。 

` N 表示 自然 数 集 ， 即 集合 {0，1，2，…}， 

大 某 集合 A 的 所 有 元 素 都 被 另 一 集合 B 包含 ， 即 如 果 xEA 昔 含 xEB， 则 写 ASEB， 
并 说 A 是 了 的 子 集 。 如 果 人 入 EB， 但 A 夫 B， 册 说 A 是 B 的 真子 集 . 写作 Ac B。， 对 任意 集 
合 A， 有 As=A。 对 两 个 集合 A 和 B，A=B 当 且 仅 当 AsB 且 BEA。 对 任 三 个 集合 A， 
下 和 C， 若 ASEB 且 BEC， 则 和 EC。 对 任意 集合 A， 丰 三 A。 

有 时 某 些 和 集合 的 定义 是 用 另 一 些 集合 给 出 的 。 给 定 一 个 集合 A， 通 过 描述 能 使 另 一 集 
人 台 卫 的 元 举 相 区 分 的 性 质 就 可 定义 BSA。 例 如， 可 将 偶数 集 定 义 为 {x: xEZ， 且 xv2 是 
整数 }。 翅 

给 定 两 个 集合 A 和 了 B， 可 以 通过 运用 集合 运算 符 来 定义 新 的 集合 : 

- 两 集合 A 和 也 的 交集 为 
A 门 B={x: xKA， 且 xEB 
- 集合 A 和 于 的 并 集 为 
ALjB={x:xcA， 或 xEB) 
集合 A 与 B 的 差 集 为 
A-B= 公 : XECA， 且 奉 B} 
集合 运算 遵循 下 列 规则 : 
空 集 律 : 
A 门 中 = 下 


ALj@=A 
等 乔 律 : 
AD 门 A=A 
AUA=A 
变换 律 : 
A 门 B=S 六 A 
ALJB=BUA 
结合 律 ; 
Anenc=Anapmc 
AUGBUC=(AUBUC 
分 配 律 : 
丰 门 (LIC)=( 门 BiLNADC) 
ABC)= AUBnAUG 9 
吸收 律 : | 
，A 站 AUB)=A 四 
AUA 站 BA 
德 莫 根 律 : 
A-(BmO= (A-B)U(A-G) 
A-(BLUC)=(A-B) 站 (A-O) (5.2) 


3 .5.9: 


{ 才 六 二 点 ~ 全 六 () = 《人 -上 1 
图 5 和 与 德 莫 杠 律 的 第 一 和 6 对 应 的 文 儿 图 





- 德 黄 根 律 的 第 一 条 由 图 5.1 加 以 说 明 。 画 中 使 用 了 文 氏 图 表示 法 集合 从 ， B 和 人 C 中 的 
. 每 一 个 都 表示 为 平面 上 的 一 个 图 ， 

通常， 旋 们 认 必 所 有 训 过 论 的 集 必 都 是 其 个 更 大 的 介 合 吕 的 子 入 该 集合 称 为 全 域 。 
例如 ， 如 果 我 们 所 考虑 的 是 由 整数 构成 的 不 同 集合 ， 则 整数 集 Z 就 是 个 全 瑾 。 给 定 一 个 全 
城 口 ， 定 必 某 集合 A 的 补 集 为 A 一 U-A。 对 任意 集合 人 二 U， 有 下 列 袍 则 ; 


六 门生 一 而 

太 LUA=UG 
德 莫 根 律 (5.2) 可 用 补 集 加 以 改写 。 对 两 集合 A，BSEU， 有 

AUB=AmnB 

AP 站 B=At 后 


一 53 一 


两 个 集合 A 和 B 是 分 离 的 ， 若 它们 无 公共 元 素 ， 即 A 让 BEH= 中。S= {Sj 梅 成 了 集合 S 
的 一 个 划分 ,车 。 
- 各 集合 两 两 不 相交 ， 即 S， SjCS，i 远 j 蕴含 SS = 一 昌 ， 且 
-它们 的 并 集 是 S， 即 
SS 一 JS， 

换言之 ， 若 S 的 每 个 元 素 只 出 现在 一 一 个 集合 SECS 中 ， 则 3 构成 了 S 的 一 个 划分 。 

一 个 混合 中 的 元 素 称 为 该 集合 的 基数 (或 大 小 )， 表 示 为 中 。 若 两 个 集合 的 元 素 可 一 一 对 
应 ， 则 说 它们 的 基数 是 相同 的 。 空 集中 的 基数 是 | 邓 |=0。 如 果 一 个 集合 的 基数 是 个 自然 数 ， 
则 说 该 集合 是 有 穷 的 ;否则 ， 它 是 无 穿 的 。 一 个 可 与 自然 数 集 N 构成 一 一 对 应 的 无 穷 集 合 被 
称 作 是 可 数 无 穷 的 ;和 否则 ， 它 是 不 可 数 的 。 整 数 集 Z 是 可 数 的 ， 实 数 集 入 是 不 可 数 的 ， 

对 任意 有 穷 集 合 A 和 B， 有 等 式 

RUB=IAHIBFIADB| 站 (5.3) 

由 此 可 得 

HUBI<IAIHHBI 

车 A 和 了 是 分 离 的 ， 则 |A 站 8B|=0， 因而 |AUB|- AIBI。 车 和 三 B， 风 AL<iBL 

一 个 含 m 个 元 素 的 有 穷 集 合 有 时 鹤 称 为 na- 集 。1- 集 称 为 单元 集 ; 某 一 集合 的 一 个 仿 上 
个 元 素 的 子 集 有 时 称 为 k- 子 集 。 

集合 $ 的 所 有 子 集 , 包括 空 集 和 S 本 身 , 称 为 $ 的 宁 集 ， 写 为 23、 例 如 ,28 量 = 各 ， 
fj， 了 tb}]，fa，b}j}，。， 有 穷 集 $ 的 寡 集 的 基数 为 2 

有 时 ， 我 们 所 关心 和 结构 与 集合 相似 ， 但 其 中 的 元 素 是 有 序 的 。 两 个 元 素 a 和 的 序 
对 表示 为 (8，b)， 其 形式 定义 为 人 4，b)= fa，{fa，bi}j。 序 对 (a，b) 与 序 对 fb.a) 是 不 同 的 。 

集合 A 与 3 的 卡 氏 积 ， 记 为 AxB， 为 所 有 这 样 的 序 对 的 集合 ， 其 第 一 个 元 素 取 自 
A， 第 二 个 元 素 取 自卫 。 更 形式 一 点 的 定义 为 

入 X 了 一 fta，b): at6A，btEB 
例如 ，{a，b} x fa，b， cj={a， al，(a，bD)， 人 ta， 口 ， 人 Pb，g)，(b，b)， 人 ， cj。 
当 A 和 B 都 是 有 伏 集 时 ， 其 居民 积 的 基数 为 


AxB=IAI 下 (5.4) 
n 个 集合 A，A，…， 直 ， 的 卡 氏 积 是 一 个 虽 元 组 的 集合 : 
入 | XXX 和 A;X， 人 一 {ai， Bo， 1，2，…，n}， 


若 每 个 集合 都 是 有 穷 的 ， 则 其 基数 为 : 
IAxAzXAX……X 丰 中 一 | 不 |Aa| 
在 某 个 集合 A 开 的 mn 重卡 氏 积 定义 为 
外" 一 和 X 站 XXX 由 
若 A 为 有 穷 ， 其 基数 为 |A"|=|AP。 一 个 了 元 组 也 可 被 视 为 一 个 长 度 为 n 的 有 穷 序 列 。 


5$.2 关 系 


两 集合 A 和 B 上 的 二 元 关系 及 是 卡 氏 积 AxB 的 一 个 于 集 。 如 果 (a，bER， 册 写作 


aRb。 说 有 是 集合 和 上 的 二 元 关系 ， 是 指 及 是 AxA 的 子 集 ， 例 如 ， 自 然 数 集 上 的 “小 于 ” 
关系 为 {ta，hb); a， bEN，a<bl。， 集 合 Ai，Aa，…，A 上 的 mn 元 关系 是 AIxAX… X 丰 。 
的 一 个 子 集 。 ， 
一 个 二 元 关 系 及 SGAxA 是 自 反 的 ， 若 

由 有 Ra 
对 所 有 agEA 成 立 , 例 如 ,“=” 和 “* 民 " 是 N 上 的 自 反 关系 ， 但 “< ” 则 不 是 。 关 系 及 是 对 称 
的 ， 如 末 

aRb 蕴含 bRa 
对 所 有 a，bEA 成 立 , 例如 ,“= "是 对 称 的 ， 但 “< ”和 “ 扩 ? 则 不 是 的 。 关 系 R 是 传递 的 ， 如 
果 ， 
aRb 和 bRec 效仿 aRec 
对 a，b，ceEA 成 立 。 例 如 ， 关 系 “<”, “<”， 与 “= ”是 传递 的 ， 但 其 系 及 = [La，b): a，b 
EN 且 a=tb 一 二 则 不 是 的 ， 再 为 3R4 和 4R5 导 不 出 3 有 RS。 

一 个 具有 自 反 性 、 对 称 性 和 传递 性 的 关系 是 一 个 等 价 关系 。 例 如 “= "是 自然 数 集 土 的 
等 价 关系 ， 便 “< "不 是 的 。 如 果 及 是 集合 A 上 的 等 价 关 系 ， 则 对 aEA，a 的 等 价 类 为 集合 
[al]= fbEA:aRbi+， 即 所 有 与 A 等 价 的 元 素 构 或 的 集合 。 例 如 ， 如 果 定 义 民 ={a，bja，b 
EN， 且 af+b 是 偶数 }， 则 及 是 个 等 价 关 系 ， 因 为 ara 是 偶数 ( 自 友 性 六 atb 是 个 数 获 合 
b+a 是 偶数 (对 称 性 ); a+b 是 侦 数 且 b+e 是 偶数 蔓 含 ate 是 个 娄 (传递 性 )。4 的 等 价 类 是 
[中 ={10，2，4，6，…}，3 的 等 价 类 是 [3]= {1，3，5，7，…}。 以 下 给 出 一 个 有 关 等 价 类 的 
基本 定理 。 

定理 5.1( 一 个 等 价 关 系 与 一 个 划分 相同 ) 由 集合 A 上 的 任意 等 价 关 系 R 所 产生 的 所 有 
等 价 类 梅 成 了 A 的 一 个 划分 :和 上 的 任 一 个 划分 决定 了 A 上 的 一 个 等 价 关系 。 且 划分 中 的 集 
合 即 构成 了 等 价 类 。 

证 明 : 对 定理 的 第 一 部 分 应 证 明 及 上 的 各 等 价 类 都 是 非 空 、 两 两 不 相交 的 集合 ， 且 所 
有 这 些 集 合 的 并 为 A。 因 为 尺 是 自 反 的 ，a&E [al]， 则 各 等 价 类 是 非 空 的 ;又 因为 每 个 元 素 atK 
A 在 等 价 类 [四 中 ， 各 等 价 类 的 并 为 &。 再 证 明 各 等 价 类 是 分 离 的 ， 即 如 果 两 个 等 价 类 [al 和 
[bj 有 公共 元 素 c， 则 它们 就 为 同一 个 集合 。 亦 即 ， 若 有 aRc 和 bRc， 由 对 称 性 和 传递 性 可 得 
aRb。 这 样 ， 对 任意 元 素 xE [al]，xRa 就 草 含 xRb， 则 [al 三 [bj。 同 理 ， 册 ]s[a。 于 是 
四 =[b]. 

为 证 第 二 部 分 ， 可 设 A={Aj 鸭 A 的 一 个 划分 ， 并 定义 及 = fla， 问 存在 i 使 ak 
A， 且 bEA+}+。 我 们 断言 R 是 A 上 的 一 个 等 价 关 系 。 首 先 ， 自 反 性 成 立 ， 这 是 因为 ac Ai 
蕴含 aRa。 其 次 对 称 性 成 立 ， 因 为 如 果 aRb， 则 a 与 b 在 同一 集合 Ai 中 ， 又 有 bRa。 兰 
aRb 和 bRe 成 立 ， 即 三 个 元 素 都 在 同一 集合 中 ， 则 aRe 成 立 ， 这 说 明 传递 性 也 成 立 。 要 证 
明 划 分 中 的 集合 构成 了 R 的 等 价 类 ， 注 意 到 车 ag Ai， 则 xc 和 Ai， 进一步 可 导电 X6E [a]. 

集合 A 上 的 二 元 关系 及 是 反对 称 的 ， 如 果 aRb 且 bRa 瑚 合 a=b。 

例如 ， 自 然 数 上 的 “<" 关 系 是 反对 称 的 ， 这 是 因为 a<sb 旦 b<a 昔 售 着 a=b。 一 个 目 
反 的 、 反 对 称 的 、 心 递 的 关系 是 个 半 序 ， 而 为 定义 一 个 半 序 所 依据 的 集合 称 为 半 序 集 。 介 . 
如 ， 关 系 “ 是 … 的 后 代 " 是 定义 在 所 有 的 人 药 集 合 上 的 一 个 半 序 。 

在 一 个 半 序 集 A 中 ， 有 可 能 没有 一 个 最 大 元 x， 使 YRx 对 任意 yEA 成 立 。 然而 ， 各 


可 能 有 用 个 极 大 元 不 存在 有 CA 使 xRy 成 立 。 例 如 ， 在 - _ 组 不 同 大 小 的 会 子 中 ， 可 
能 有 用 个 极 大 的 盒子 ， 它们 放 不 进 任何 其 他 一 个 盒子 ， 伍 台 不 存 存 一 个 "最 大 "的 使 得 性 何其 
他 的 伪 子 都 能 放 人 - 

集合 A 上 的 半 序 及 是 全 序 的 吉 线 性 序 的 ， 如 果 对 任意 a，bE A， 有 有 aRb 或 bRa， 即 
A 的 每 一 对 元 素 之 间 都 存在 R 关系 。 例如， 自然 数 上 的 *<" 关 系 是 个 全 序 ， 但 定义 在 所 有 
人 类 集合 上 的 “是 … 的 后 伐 ? 却 不 是 个 全 序 ， 因 为 存在 一些 人 他 们 互相 不 为 后 代 。 


5.3 函数 


给 定 两 个 集合 A 与 B， 函 数 f 是 久 x 了 上 的 一 个 二 元 鞠 系 ， 使 得 对 所 有 的 aEA， 仅 存 
在 一 个 be 了 有 tbef。 集合 A 称 为 了 的 定义 域 ， 集 合 了 称 为 了 的 孙 感 ， 也 可 将 评 数 写 汶 . 
fA-~B; 且 如 果 (a，bEf， 就 写 b=fay， 内 为 b 的 值 由 a 蕉 -一 地 决定 : 

从 直觉 上 看 ， 范 数 f 将 B 中 的 每 个 元 素 与 A 中 的 一 个 元 索 对 应 起 来 。A 中 没有 一 个 元 
素 会 对 应 于 B 中 丁 个 不 同 的 元 素 ， 但 反之 却 是 成 立 的 。 例 旭 ， 僵 元 关系 

f= ff(a，bjaEN，b=aimod2} 
就 是 个 尊 数 EN->{t0，1， 因为 对 每 个 贞 然 数 9， 恰 有 10. 时 中 的 一 个 值 吕 使 b=a 中 od 2 在 
此 例 中 ，0= F(0)，1= F(D)，0= R(2， 等 等 。 再 看 站 一 个 - - 谍 关 系 

g={a，bjac N，a+b 是 倡 数 1 
则 不 是 个 函数 ， 因 为 (1，3) 和 (1， 3) 都 在 外 中 ， 冯 对 a= 1， 站 在 不 引 一 个 的 b 使 dt，b)E g。 

给 定 一 个 函数 EA-=~B， 如 果 B= Ra)， 称 a 为 了 的 请 变 量 ，b 为 上 在 a 处 的 值 。 我 们 可 
以 通过 给 出 对 应 于 定 尽 域 中 每 一 点 . 二 的 落 数 值 的 方式 来 定义 冰 数 。 例 旭 ， 对 nm MN， 可 和 定义 
fm=2n。 该 函数 即 f= {，2njng IJ 。 两 个 函数 了 『 积 守 是 相等 的 ， 如 果 它 们 有 相同 的 值 
和 年 义 碟 ， 且 对 定义 城中 的 所 有 a， faj) = 纪 可 。 

一 个 长 度 为 上 的 有 宅 序 列 是 一 个 函数 ， 站 广 于 为 集合 加， 0 no 一 1}. 我 们 向 常 通 
过 列举 其 值 的 方式 来 表示 一 个 有 穷 序列 ; {RO)， 丈 1， | -个 无 穷 译 列 是 一 个 男 
数 ， 其 定义 域 是 自然 数 集 N。 例如 由. 证 双 的 著名 娄 序 列 及 是 一 个 天 舌 列 
<0，1，1，2，3，5，8，13，217 

当 丁 【的 定 义 吉 是 个 上 氏 积 时 我 们 尖 肯 中 到 到 外 的 扫 作 ?的 自 友 是 的 括 避 ， 例如 ， 
如 果 AIXxA2x …xAuweB， 则 写 = ai， 人 at 而 不 丰 昌 = 人 (的 ， 且 2， …， 3 
这 时 ， 称 每 个 a 都 是 了 的 自 变 量 ， 昌 然 从 技术 上 讲 了 的 自 蛮 娃 应 为 恒 元 组 (alj，a，…， 
a)。 
如 果 fA-=> 了 B 是 个 函数 日 b= faly， 有 上 时 就 称 b 为 fT 下 as 的 像 。 在 f 下 集合 AEA' 的 像 如 
下 定义 
ADI= 了 GEB:b=fa)， 对 某 个 aEA 个 
工 的 值 域 是 其 定义 域 的 像 ， 即 RA)。 例如 ， 由 fo 加 定义 的 函数 EN 一 N 的 人 惜 域 为 
fN)= om 二 2n. 对 nEj， 

一 个 函数 是 满 射 的 ， 若 其 值 起 与 随 墟 相同 。 例如 ， 画 数 fo 二 [ny2 是 从 N 到 N 的 
满 射 ， 因为 N 中 的 每 个 元 素 都 是 了 的 对 应 某 个 自 变量 的 值 。 相对 地 ， 卫 数 fm)= 2n 就 不 是 
N 到 N 的 满 射 ， 因为 没有 任何 自 变量 可 以 导出 函数 佳 3， 但 Km= 2n 是 个 从 自然 数 集 到 偶 


- 数 集 的 一 个 满 射 。 有 时 把 一 个 满 身 下 入 - ~B 描述 为 人 到 B 上 的 史册 当 我 们 说 ?是 到 上 的 ， 
是 指 了 基 满 射 的 。 

， 陋 数 七 A-~~B 是 单 射 ， 如 果 f 的 不 同 币 变量 对 应 不 同 的 值 ， 亦 即 ， 若 aa 有 Fa) 基 
F(a])。 例 如 ， 郴 数 Fm) 一 2 是 从 入 到 的 一 个 单 射 ， 因为 每 个 偶数 b 是 定义 域 中 至 多 一 
个 元 素 的 像 ， 冰 数 fm) 一 L ny2] 本 起 单 射 ， 因为 值 可 由 自 变 量 2 种 3 产生 ， 单 射 也 称 为 
一 对 一 函数 。 

函数 人 A 一 B 是 个 驱 射 ， 九 果 [ 聊 是 单调 又 是 满 和 例如 项 雪 fm=Ci rn72 刘 
有 从 和 到 工 的 一 个 双 射 : 四 
0-=0， 
1 一 一 1， 
2-r1，- 
3 一 2， 
4 2， 


该 函数 是 单 射 的 .因为 中 没有 一 个 元 素 是 N 中 多 于 一 个 元 素 的 虱 ; 它 又 是 满 射 的 ， 
因为 Z 中 的 每 一 个 元 素 都 是 N 中 基 个 元 素 的 像 。 所 以 ， 该 画 数 是 双 射 的 ， 双 射 有 时 又 被 称 
为 一 一 对 应 ， 二 为 它 将 定义 域 和 陪 域 中 的 庆 素 成 对 地 联系 起 来 了 ， 在 集 含 A 上 的 一 个 双 射 
才 称 为 变换 。 

当 范 数 于 是 双 射 时 ， 其 送 申 数 全 定义 为 

六 (9)=a 当 上 县 仪 当 Ra) 一 


例如 ， 旺 数 fn) 了 rmyv2 ij 的 道 衣 数 为 
fm 一 { 季 如 果 m 产 闵 


2m 一 旭 果 囊 <0 
.4 于 


这 一 节 介 绍 两 种 图 :有 向 图 和 无 向 图 。 本 文中 给 出 的 某 些 定义 与 其 他 文献 中 可 能 不 同 ， 
但 大 部 分 都 是 差不多 的 。 第 23.1 节 要 介绍 图 在 计算 机 中 的 存储 表示 . 

一 们 有 向 图 G 是 个 对 (V， 针 ， 契 中 V 是 有 穷 集 ， 下 是 V 上 前 一 元 关系 。 集 合 V 称 为 贰 
G 的 顶点 集 。 其 元 素 为 图 的 顶点 。 集 合 称 为 图 G 的 边 集 ， 其 元 素 为 图 的 边 。 图 5.2(a) 是 
二 人 机 高 委 为 人 2，3，4，5， 对 的 有 向 图 的 形象 表示 。 其 中 V={L，2，3，4，5， 晤 ， 
下 = 人 (1， (2，2)，(2，4)，(2，5，(4， 切 ，{(4，5)，(5，4)，(6，3)》 |) 边 忆 ， 
2 是 个 上 下 在 图 中 ， 顶 点 用 图 余 表 示 ， 边 用 箭头 表示 。 注意 由 一 个 顶点 到 其 月 身 的 自 辐 
小 是 可 能 的 。 

在 一 个 无 向 留 马 =(V， 也 ) 中 ， 边 集 下 由 无 序 的 顶点 对 构成 ， 弓 每 一 边 都 是 个 边 集 fu， 
中，0，YEYVY，uzv。 为 了 遵循 懒 例 ， 我 们 将 用 记 导 如 ，v) 来 表示 一 条 进 ， 而 不 用 集合 记号 
fu，vw 但， 由 和 ({v，U) 砚 为 同一 条 边 。 在 一 个 无 向 图 中 ， 自 园 路 是 不 允许 的 ， 这 样 每 条 过 就 
恰 含 两 个 厅 同 的 顶点 。 图 5.2(b) 是 一 个 顶点 集 为 {1，2，3，4，5， 癸 的 无 向 图 的 表示 。 其 中 
V={L，2，3，4，5，6j，BE=f (1，2)，(1，5)，(2， 约 ，(3， 国 }。 顶 点 4 是 孤立 的 。 


一 5 一 


4) G 
(fb] 位 ] 
图 5.2 有 疝 图 与 无 向 图 





有 关 有 向 图 和 无 向 图 的 许多 定义 是 相同 的 ， 只 是 某 些 术语 的 含义 会 有 所 变化 。 如 果 (u， 
内 是 有 向 图 G= (wY， 孔 中 的 一 条 边 ， 我 们 说 (u， 离 开 顶 点 u， 进 和 顶点 v。 例 如 在 图 5.2(a) 
中 ， 离 开 顶 点 2 的 边 有 (2， 思 ，(2， 及 和 (2，5 进 和 顶点 2 的 边 有 (1， 习 和 (2， 妇 。 若 (u。) 
是 无 向 图 G= (V， B) 中 的 一 条 边 ， 则 说 (u， yj 与 顶点 习 和 v 关联 。 在 图 5.2(b) 中 ， 与 顶点 2 
关联 的 边 有 (1，2) 和 (2， 习 。 

如 果 人 ， 风 是 图 G=(V，HE) 中 的 一 条 边 ， 则 说 顶点 v 与 与 顶点 邻接 。 当 该 图 为 无 向 图 
时 ， 这 种 邻接 关系 是 对 称 的 。 当 该 图 为 有 向 图 时 ， 邻 接 关系 就 不 一 定 是 对 称 的 了 。 在 一 个 有 
向 轿 中 ， 如 果 vY 与 u 邻接 , . 则 写作 mv。 在 图 5.2 的 (ay 和 fb) 中， 顶点 2 与 顶点 了 邻接 ， 因 
为 (1，2) 边 同属 于 两 个 图 。 顶 点 1 在 图 5.2(aj 中 不 与 顶点 2 邻接 ， 因 为 边 (2，1T) 不 在 该 图 
中 。 

在 无 向 图 中 一 个 顶点 的 度 是 指 与 之 关联 的 边 的 数目 。 例 如 ， 图 5.2(b) 中 顶点 2 的 雇 为 
2。 在 有 向 图 中 ， 一 个 顶点 的 出 度 是 指 离 开 它 的 边 的 数目 ， 而 人 度 则 是 指 进 入 它 的 边 的 煞 
目 。 有 向 图 中 一 个 顶点 的 度数 是 其 出 度 与 人 度 和 。 在 图 52(9) 中 ， 顶点 2 的 人 订 为 2， 出 度 

为 3， 其 度数 为 5。 
在 图 台 =(V， 也 中， 由 顶点 u 出 发 至 顶点 的 长 度 为 k 的 路 和 公 是 一 个 顶点 序列 <w， 
Vi，V2，…， 呈 >， 其 中 = = 兴 且 (viEE，i=1，2，…，X。 了 路 径 的 长 度 等 于 
其 中 所 售 的 边 数 。 该 路 径 包 合 顶 点 TY0 YI 与 边 (vu， Vi (Y1，Y2)，…， (ve Vi 


如 果 存 在 从 到 必 的 路 径 p， 则 称 岂 对 经 过 p 是 可 达 的 ， 有 时 也 可 写作 一 ww( 如 果 台 是 


有 向 的 )]， 如 果 一 条 路 径 上 的 所 有 节点 均 不 相同 ， 则 该 路 径 是 简单 的 。 在 图 5.2(a) 中 ， 上 路径 
<1，2，5，。4> 是 简单 的 ， 长 度 为 3， 刻 径 <2，5，4。5，> 不 是 简单 的 。 

路 径 pb= <Yo，Vvi，…，> 的 一 条 子路 径 是 其 顶点 序列 中 的 一 段 连续 的 子 序 列 ， 即 对 
任何 0<si<j<k， 顶 点 序列 <w，Vwa，…，> 即 为 虽 的 一 段子 路 径 。 

在 有 问 圈 中， 路 径 <vo，vV，…， 瑟 > 构成 一 个 回路 ， 如 果 间 =w 且 该 路 径 包 合 至 少 一 
条 边 。 更 进一步 ， 该 回路 是 简单 的 ， 如 果 Yi，v，…， 怀 汐 不 相同 ， 一 个 自 回 路 是 长 床 为 1 


入 加 路。 两 条 路 径 <vo，V wm，…， 人 帮 -hi， ve> 和 < ， Te ” > 为 同一 


] 工 亚 一 | 


回路 ， 如 果 存 在 整数 j 使 得 = P，，，i=0，1，…，k-1。 在 图 5.2(a 中 ， 路 径 <1， 


2，4，1> 与 <2，4，1，2> 和 <4，1，2，4> 为 同一 回路 。 该 回路 是 简单 的 ， 而 回路 
< 1，2，4，5，4，1> 却 不 是 简单 的 ， 回路 (2，23) 是 一 个 自 回 路 。 不 存在 自 回路 的 有 向 图 是 
简单 的 。 在 无 癌 机 中 ， 路 径 <vn， We 帮 > 构 成 一 个 回路 ， 如 果 W0 一 Viy 且 Yi， Was 


…， 玫 均 不 相同 。 例 如 ， 在 图 $.2(b) 中 ， 路 径 <1, ,2，5$，1> 就 是 个 回路 。- 一 个 不 含 回路 的 
图 是 非 循环 的 。 

一 个 无 向 图 是 连通 的 ， 如 果 其 每 一 对 顶点 都 有 一 条 路 径 连 接 。 一 个 图 的 连通 子 图 是 在 
“可 达 " 关 系 下 的 顶点 的 等 价 类 。 图 5.2(b) 中 有 三 个 连通 子 图 ,{1，2， 守 ，{3， 寻 和 {41。 在 
ft1，2， 引 中 ， 每 一 个 顶点 都 可 由 {L，2，5 引 中 的 另 一 个 顶点 达到 。 一 个 无 向 图 是 连通 的 ， 如 
果 它 仅 包 含 一 个 连通 子 图 ， 即 每 一 个 顶点 对 其 他 任 一 顶点 都 是 可 达 的 。 

一 个 有 向 图 中 强 连通 的 ， 如 果 每 两 个 顶点 都 是 相互 可 达 的 。 一 个 图 的 强 连 通 子 图 是 在 
“互相 可 达 " 关 系 下 顶点 的 等 价 类 。 一 个 有 向 图 是 强 连通 的 ， 如 果 它 仅 售 一 个 强 连 通 子 图 。 图 
5.2(a) 中 含有 三 个 强 连通 子 图 :11，2，4，、 引 ， 和 3} 和 {16}。{1，2，4， 有 外 中 的 所 有 顶点 都 是 两 
两 可 达 的 ， 而 项 点 {3， 生 不 构成 一 个 强 连 通 子 图 ， 因 为 顶点 6 不 能 由 3 达到 。 

两 个 图 台 =(V，B) 和 G= (V'，EI) 是 同 构 的 ， 如 果 存 在 一 个 双 射 上 V 一 V'， 使 得 ， 吕 
《BE 当 且 仅 当 (fm 和 ，fw)E BE。 换 句 话说， 我 们 可 将 G 的 所 有 顶点 都 重 标 为 G/ 的 顶点 ， 同 
时 还 保持 G 和 G' 中 的 对 应 边 。 图 5.3(a) 给 出 了 一 对 同 构图 扣 和 G， 各 自 的 顶点 集 为 
V={ 培 ，2，3，4，5， 轩 和 网 = 得 ，v， ww，X，Yy， 中 。 由 到 到 的 了 映 射 是 个 双 射 :TDT) 一 ， 
f2)=v，f3)=w，RD=x，fK5)=y，f6)=z。 图 5.3(b) 中 的 两 个 图 则 不 是 同 构 的 。 昌 然 两 个 、 
图 都 含 5 个 顶点 和 7 条 边 ， 但 上 曾 的 那个 图 中 有 个 度数 为 4 的 顶点 ， 而 下 面 的 图 中 则 没有 这 
样 的 顶点 。 

说 一 个 图 己 一 (V“，BE) 是 图 台 =(VY，B) 的 子 图 ， 如 果 WEV，BEEE。 给 定 一 个 集合 W 
三 VW， 由 导出 的 纪 的 子 图 为 台 '=(V'，BI， 其 中 

E"={fa，vEEnu，vEV4 





图 4.3 同 构 驾 和 非 同 构图 


图 5.2(a) 中 由 顶点 集 {1，2，3， 癸 导出 的 子 图 如 图 52(e) 所 示 ， 含 边 集 {1， 人 ，(02， 
2)， (6， 3)1。 四 

给 定 一 个 无 向 图 G=(V，B， 其 有 向 对 应 图 为 图 Gf=(V'，E]， 其 中 心 ，w) 《也 当 且 
仅 当 (au，vVE 了 3。 亦 即 ，G 中 的 每 一 条 无 向 边 (u，w 由 其 有 向 对 应 图 中 的 两 条 有 向 边 ， 
(u，W) 和 (〈(v，uj 代替 。 给 定 一 个 有 向 图 G= (V，PE)， 其 无 向 对 应 图 为 无 向 图 Gr= 
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(V'，BE)7， 其 中 (a， 人 由 《E' 当 且 仅 当 uv， 旧 (人 ，v) 二 E。 亦 即 ， 将 台中 边 的 方向 以 
及 自 回 路 去 掉 ，( 因 为 (u，Y) 和 (v， 屿 在 无 向 图 中 为 同一 条 边 ， 有 向 图 的 无 向 对 应 图 中 
仅 含 一 条 《ua， 人 边 ， 训 使 原 有 向 图 中 腊 含 边 (u， 又 告 边 〈(v， 由 )。 在 有 向 图 G= 
(V，U) 中 ， 顶 点 的 邻接 点 是 所 有 那些 在 后 的 无 向 对 应 图 中 与 a 邻接 的 顶点 ， 即 v 是 aa 
的 邻接 点 ， 如 果 人 nu，vY) 《E， 或 者 (v， 划 《E。 在 无 向 图 中 ，u 和 v 如 果 互 相 邻 接 就 互 
为 邻接 点 。 四 四 
”有 几 类 图 有 着 特定 的 和 名称- 一 个 完全 辑 是 个 无 向 图 、 其 中 每 对 顶点 都 互相 六 接 。 一 个 二 
分 图 县 个 无 自 图 G= (〈V，E)， 其 中 V 可 被 划分 为 两 个 集合 Vi 和 V2， 使 得 (u，v) EB 
区 含 uCVI，veV 或 ugV，vEV 也 就 是 说 ， 所 有 过 的 两 个 顶点 都 分 别 落 在 V 和 V: 
中 。 一 个 老 同 上 路、 无 向 的 图 是 个 森林 ; 一 个 连通 的 、 无 同 路 、 无 向 的 图 是 一 棵 〈 自 由 ) 树 
{ 吕 第 5.5 节 )。 我 们 还 逢 常 将 “有 向 非 循环 图 ” (directed acyclic graph) 简称 为 dag。 

读者 可 能 会 偶而 磁 到 两 种 图 的 变种 , 即 多 重 图 和 超 图 。 与 无 向 图 类 似 ， 但 它 可 以 含有 多 
重 边 。 起 图 与 无 向 图 类 似 ， 但 它 售 有 超 边 。 趣 边 连 接 的 是 任意 的 两 个 顶点 集 的 子 集 ， 而 不 是 
仅 连接 两 个 顶点 。 许 多 适用 于 普通 无 向 图 和 有 向 图 的 算法 经 过 适当 修改 就 可 用 于 这 些 结构 上 
面 。 


5S.5 树 
就 像 图 一 样 ， 有 不 少 相关 的 但 又 略 有 不 同 的 树 的 表示 。 这 一 节 给 出 树 的 定义 和 数学 性 
质 。 第 11.4 节 和 23.1 节 还 将 介绍 树 在 计算 机 中 的 存储 表示 问题 . 


sS.4.1 自由 树 


如 第 5.4 节 中 定义 的 那样 ， 自 由 树 县 连通 、 无 回路 、 无 商 的 图 。 当 说 一 个 图 是 一 樟树 
时 ， 我 们 常常 略 去 形容 词 “ 身 由 "。 如 果 一 个 无 向 图 是 非 循环 的 ， 查 可 能 是 非 连通 的 ， 黄 称 之 
为 森林 。 许 多 适用 于 树 的 算法 也 适用 于 森林 。 图 5.4 (a) 中 给 出 了 一 棵 自由 树 ， 图 5.4 
(b) 中 是 个 森林 ， 它 之 所 以 是 森 宁 而 不 是 树 是 因为 它 是 不 连通 的 。 图 5.4 《ec) 中 的 图 赋 不 
是 树 也 不 是 森林 ，。 因 为 其 中 含有 一 -个 回路 。 四 


- 





《b+ 人 e) 
图 5.4 自 出 树 ， 森 林 与 非 树 非 末 林 必 


以 于 定理 反映 了 树 的 一 些 重要 性 质 。 
定理 $.2 《自由 树 的 性 质 ) ” 设 怠 = {V，BE) 为 无 向 图 。 以 下 说 法 都 是 等 价 的 : 


1.G 是 棵 自由 树 ; 

2.G 中 任意 两 个 顶点 都 由 唯一 的 一 条 简单 通路 连接 。 

3.G 是 连通 的 ， 但 如 果 从 G 中 去 掉 任 一 边 的 话 ， 则 图 变 为 不 连通。 

4.G 是 连通 的 ，| 下 = 人-1. 

5.G 是 非 循环 的 ，HB|=Yf1 

6.G 是 非 循环 的 ， 得 车 向 五 中 任 加 一 边 ， 则 团 中 包含 回路 ， 

证 明 (1D 一 《2): 因为 树 是 连通 的 ，G 中 的 任意 两 点 由 至 少 一 条 简单 路 径 连 通 。 设 " 
和 * 为 由 两 条 不 同 的 简单 的 通路 p, 和 p, 连接 的 顶点 ， 如 图 5.5 所 示 。 

设 w 为 两 条 路 径 开 始 分 岔 的 顶点 ; 即 w 是 一 个 既 在 pb 上 又 在 pm 上 的 预 点 ， 它 在 pl 上 
的 后 继 为 x， 在 证 上 的 后 继 为 yY， 且 x#y。 设 z 为 丙 条 路 径 重 又 交叉 的 第 -一 个 预 点 ， 即 z 是 
第 一 个 继 w 的 之 后 的 媳 在 P 上 又 在 bp 上 的 项 点 。 设 P” 为 pi 的 从 ww 经 xx 到 z 的 子路 径 ， 
p?” 为 p, 上 从 ww 经 y 至 z 的 子路 径 。 队 端 结 点 外 ，P ”和 pp * 无 公共 顶点 。 将 DB′ 和 py 的 
逆 连 接 之 后 就 得 到 一 条 回路 。 这 就 出 现 了 矛盾。 因而 。 如 果 台 是 棵 树 ， 则 在 任 两 顶点 逆 至 


案 丰 在 一 条 路 径 , 
户 
一 一 一 人 一 一 、 
7 so 
沪 
图 5.5 定 事 5. 的 证 表 中 的 一 个 步骤 


(2) -一 (3): 如 果 G 的 任意 两 守 列 点 由 唯一 的 简单 路 径 连 接 。 则 G 是 连通 的 . 设 
(u，v) 为 至 中 的 任意 一 条 边 。 这 条 边 是 u 到 v 何 的 一 条 通路 ， 所 以 必 是 从 到 *Y 的 唯一 通 
路 。 如 果 我 们 从 台中 去 掉 (ua，Y)， 则 性 和 v 之 间 训 不 存在 适 路 了 ，G 也 就 不 连通 了 ， 

(3) -~ 《4): 由 假设 ， 图 G 是 连通 的 ， 又 据 练 习 5.4-4， 有 | vimi1。 我 们 将 利用 好 
纳 法 来 证 明 jE| 扩 |v 扩 1。 一 个 有 8= 1 或 n=2 个 顶点 的 连通 图 有 na-1 条 边 ， 假 设 扣 有 nz>3 
个 项 点 ， 且 所 有 满足 (3) 的 含 丰 上 于 mn 个 顶点 的 图 都 满足 IB|<IVl-1。 有 从 避 中 任 去 一 边 即 
将 图 分 为 z>2 个 过 通 子 图 (实际 上 玉 = 人 32。 每 个 子 图 都 满足 (3)， 否 则 局 就 不 满足 (3) 。 
这 样 ， 根 据 妆 纳 法 ， 所 有 子 图 中 的 边 加 起 来 至 多 为 |v|l-k<iVi-2。 把 先前 去 掉 的 那 条 边 补 于 
就 有 |EI<IVHF!。 

(4)》 一 《5) : 假设 G 是 连通 的 ， 县 | 到 =IVF1， 要 证 明 G 是 非 循 环 的 。 候 设 G 中 有 回 
路 含 K 个 节点 ww，V，…，wk。 又 设 G= (Vi ， 至) 为 包含 该 同 路 的 G 的 子 图 .要 注意 
IVgd=]E|=K。 如 果 <IVi， 则 必 有 顶点 wiiE V-WVi 与 某 个 顶点 WE Vi 相 邻 ， 交 为 台 是 连 
通 的 。 定 义 Geni= (Von Er 为 吕 的 子 图 ， Ver 一 Wwe we Eee 一 Be iv 
”时 息 。 注 意 |Vil= 医 .=k+l。 如 果 k+I<na， 我 们 可 以 继续 同样 定义 Gu， 等 等 ， 直 到 
有 G.=(V，E )， 其 中 mn= 人 YI =V， 上 且 |EJ=iv=1IVI， 因 为 Gn 是 避 的 子 图 ， 则 有 E。 
兰 己 ， 因 而 目 |>IVl- 这 与 假设 |B=1Vf1 矛盾。 所 以 ，G 是 非 循环 的 - 
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(36 人 根 设 台 是 非 循环 的 ， 且 IEI=|VF1。 又 设 上 为 扣 的 连通 子 图 的 个 数 ， 每 个 连通 
子 图 痢 是 棵 自由 树 。 因 为 (1 芍 含 《3) ， 所 有 连通 子 图 中 边 的 和 为 |VI-k。 这 样 必 有 ， 
k=1， 台 实际 上 即 为 一 棵 树 。 又 因为 (1) 草 含 (2)，G 中 任 两 顶点 都 由 唯一 的 简单 路 径 连 
接 。 这 样 ， 疝 台 中 加 一 条 边 就 会 产生 一 个 回路 。 

(6 一 (1U: 假设 台 是 非 怎 环 的 ， 但 如 果 任 加 一 条 边 则 会 产生 回路 。 要 证 明 G 是 连通 
的 。 说唱 积 v 为 G 中 的 顶点 。 如 果 和 YY 不 相 邻 ， 增 加 边 《ua，v) 就 产生 一 个 回路 ， 其 中 
除 (u，v) 外 的 所 有 边 都 属于 G。 这 样 ， 价 到 v 就 存在 一 条 通路 ， 又 因为 u 和 v 是 任意 
选择 的 ， 所 以 台 是 连通 的 。 


5.5.2 ”有 很 树 和 有 序 树 


一 标 有 根 树 是 一 棵 自由 树 ， 其 中 一 个 顶点 与 其 他 顶点 不 同 ， 为 该 树 的 根 。 我 们 常 把 有 根 
树 中 的 顶点 称 为 节点 。 图 5.6 {a) 给 出 了 一 棵 含有 12 个 节点 、 高 度 为 4 的 有 根 树 ， 这 棵 树 
是 以 标准 的 方式 画 出 的 : 根 (节点 7) 在 顶端 ， 其 子女 《深度 为 1 的 那些 节点 ) 在 它 下 面 ; 
这 些 节点 的 子女 〈 深 度 为 2 的 节点 ) 又 在 它们 的 下 面 ， 等 等 。 如 果 该 树 是 有 序 的 ， 则 某 一 节 
点 的 各 子女 的 相对 自 左 至 右 次 序 就 很 重要 了 ; 否则 ， 就 没什么 关系 。 (bj 中 是 另 一 棵 有 根 
树 。 : 

设 x 为 根 为 * 的 有 根 树 T 中 的 节点 。 在 由 到 x 的 唯一 路 径 上 的 任 一 节点 y 称 为 x 的 一 
个 祖先 ， 而 x 就 是 y 的 一 个 子孙 。 (每 个 节点 是 其 自身 的 祖先 和 子孙 .) 如 果 y 是 x 的 祖先 ， 
且 x#y， 则 了 是 x 的 真 祖先 ，x 是 y 的 真子 孙 。 根 为 x 的 子 树 是 由 所 有 x 的 子孙 构成 的 树 ， 
其 根 为 x， 例 如 ， 在 图 5.6 (a) 中 ， 以 节点 8 为 根 的 子 树 包 含 节点 8，6，5 和 9。 

如 果 从 根 工 到 大 的 路 径 上 的 最 后 一 条 边 为 (y，x， 则 y 是 x 的 父亲 ，x 是 了 的 孩子 。 
根 是 树 中 唯一 没有 父亲 的 节点 。 如 果 两 个 节点 有 相间 的 父 节 点 ， 则 它们 是 兄弟 。 一 个 没有 和 孩 
子 的 节点 是 个 外 节点 或 叶子 。 一 个 非 叶 节点 是 个 内 节点 . 

有 根 树 T 中 节点 x 的 子 节点 数 称 为 x 的 度 。 坝 根 T 到 节点 x 的 路 径 的 长 度 为 x 在 树 中 
的 深度 。 树 中 节点 的 最 大 深度 是 树 的 高 户 。 

有 序 树 是 棵 有 根 树 ， 其 中 每 个 节点 的 子 节点 都 是 有 序 的 ， 即 如 果 一 个 节点 有 k 个 子 节 
点 ， 则 其 中 就 有 第 1 个 ， 第 2 个 ，…， 第 个 子 节点 。 图 5.6 中 的 两 棵 树 在 被 视 为 有 序 树 时 
是 不 同 的 ， 但 若 仅 被 视 为 是 有 根 树 时 则 是 相同 的 ， 因 为 节点 3 的 各 子女 出 现 的 次 序 在 两 个 图 
中 不 同 ， 
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图 56 有 根 树 和 有 序 树 


5.3 二 叉 树 和 位 置 树 


对 二 叉 树 可 以 递归 地 加 以 定义 。 一 棵 二 叉 树 T 是 定义 在 满足 以 下 条 件 的 节点 集 上 的 结 
构 : 
- 不 含 任何 节点 ， 或 四 
- 由 三 个 不 相交 的 节点 集 构成 : 一 个 根 节点 ， 一 标 称 为 左 子 树 的 二 义 树 ， 一 棵 称 为 右 子 
树 的 二 叉 树 。 
不 含 任何 节点 的 二 闵 树 称 为 空 树 ， 有 时 可 用 NIL 表示 。 如 果 左 子 树 非 空 ， 则 该 子 树 的 _ 
根 被 称 为 整 棵 树 的 根 的 左 子女 。 类 似 地 ， 非 空 右 子 树 的 根 称 为 整 棵 树 的 根 的 右 子 女 。 如 果子 
树 是 空 树 NIL， 则 称 该 节点 是 缺失 的 。 图 5.7 (a) 示 出 了 以 标准 方式 画 出 的 一 棵 二 又 树 。 
某 一 节点 的 左 孩子 被 画 在 该 节点 的 左下 方 ， 右 孩子 画 在 它 的 右 下 方 。 
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一 叉 树 不 单单 只 是 每 个 节点 的 度 至 冤 为 2 的 有 序 树 。 例 如 ， 在 一 棵 二 叉 树 中 ， 如 果 某 个 
节点 仅 有 一 个 子女 ， 则 无 论 它 是 个 左 子女 或 右 子 女 ， 它 的 位 置 就 很 重要 了 。 而 在 一 棵 有 序 树 
中 ， 某 节点 的 子女 只 有 一 个 时 其 位 置 是 无 关 紧 要 的 。 图 5.7 (b) 示 出 了 一 棵 与 图 5.7 (al) 
中 不 同 的 二 叉 树 ， 在 (aj 中 ， 节 点 7 的 左 孩子 为 5， 没 有 右 孩 子 。 在 《bj 中 ， 节 点 7 的 左 
孩子 缺失 ， 右 孩子 为 5。 作 为 有 序 树 ， 这 两 标 树 是 相同 的 ; 而 作为 二 六 树 ， 它 们 是 不 同 的 . 

二 叉 树 中 的 位 置信 息 可 由 有 序 竺 的 内 节点 来 表示 , 如 图 $.7(D 所 示 。 用 一 棵 满 二 叉 树 中 
的 内 节点 来 表示 (a) 中 的 二 叉 树 : 这 棵 有 序 树 中 每 个 内 节点 的 度数 为 2。 树 中 的 叶 节 点 用 
方块 表示 。 其 思想 就 是 用 一 个 没有 子女 的 节点 来 代替 二 叉 树 中 缺失 的 每 一 个 子女 。 在 图 中 这 
些 叶 节 点 被 画 成 是 方形 的 。 这 样 所 得 的 一 棵 树 就 是 完全 二 叉 树 : 每 个 节点 或 是 叶子 或 恰 有 两 
“个 子女 ， 不 存在 度 为 1 的 节点 。 这 样 一 来 ， 一 个 节点 的 子女 间 的 次 序 也 就 反映 出 了 位 置信 
息 。 和 

这 种 使 二 叉 树 区 别 于 排序 树 的 位 置信 息 还 可 被 扩充 到 另 一 种 位 置 树 中 。 其 中 每 个 节点 的 
子女 可 以 多 于 亢 个 。 在 一 棵 位 置 树 中 ， 节 点 的 子女 被 标 以 不 同 的 正 整 数 。 如 果 没 有 一 个 节点 
被 标 为 i 则 第 i 个 子女 是 缺失 的 。k 叉 树 是 这 样 一 棵 位 置 树 ， 其 中 每 个 节点 的 标号 大 于 的 
子女 都 向 失 。 这 样 ， 二 叉 树 就 是 k= 2 的 k 叉 树 . 

完全 k 又 树 是 其 中 每 个 内 节点 的 度 为 X、 所 有 叶 节点 的 深度 都 相同 的 叉 树 。 图 5.8 中 
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是 一 棵 高 度 为 3 的 完全 二 叉 树 ， 

一 棵 完全 Kk 叉 树 的 叶子 共有 多 少 呢 9 根 有 这 度 为 1 的 k 个 隆 龙 ， 其 中 每 一 个 又 有 深度， 
为 2 的 个 子女 ， 等 等 。 这 样 ， 在 深度 h 处 的 时 子 共有 个 。 反 之 、 有 nm 片 叶 子 的 完全 
叉 树 的 高 度 为 logkn。 另 外 ， 高 度 为 的 完全 k 受 树 中 内 节点 数 为 : 


[十 K 十 k 十 十 KK 


[四 





KK . 站 
=- 站- ( 据 等 式 (33) ) 


据 此 ， 一 棵 完全 二 叉 树 共有 2h~1 个 内 节点 。 


这 度 站 ， 





这 度 | 
高 虚 =3 
沫 度 > 一 - 
评 度 3 


图 58 ”一 棵 高 度 为 3、 共 有 8 个 时 节点 和 了 个 内 节点 的 完全 二 多 机 
思 考 题 


s-1 图 的 关 色 问题 


一 个 无 向 图 台 = 《VY， 了 P) 的 k- 着 色 是 个 函数 c，V-{0，1，…，K- 续 ， 使 得 对 每 一 条 
边 (um 《ECE 有 5c (ay 地 c (换言之 ， 数 0，1，…，kr1l 代表 了 k 种 颜色 ， 相 邻 的 项 
点 必须 着 不 同 的 颜色 。 

a. 证 明生 意 一 棵 树 都 是 2-- 可 着 色 的 。 

.证 明 以 下 各 说 法 是 等 价 的 : 过 

人 .各 是 二 分 图 ; 
区 . 避 是 2 一 可 着 色 的 ; 

”全 .G 中 设 有 长 度 为 奇数 的 回路 。 

c. 设 马 中 所 有 项 点 的 最 大 座 数 为 d。 证 骨 可 用 d+i 种 颜色 对 台 着 色 。 

d. 证 明 : 如 果 G 有 D (Vv|) 条 边 ， 可 用 〇 (VIVI) 种 颜色 对 G 着 色 。 


SS-2 . 变 好 画 


把 以 下 各 陈述 句 改写 为 关于 无 向 图 的 定理 。 然 后 证 明之 。 假 没 友 这 是 对 称 的 ， 但 非 自 
反 : 
a. 在 任意 一 组 n>>2 个 人 中 ， 有 两 个 人 在 该 组 中 有 相同 数目 的 朋友 。 
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b. 含 六 个 人 的 一 组 人 中 ， 有 三 个 人 互 为 朋友 ， 战 有 三 个 人 互 为 陌生 人 。 

“ 任 一 组 人 都 可 被 分 为 两 小 组 ， 使 得 任 一 小 组 的 每 个 人 都 至 少 有 一 半 朋 友 在 另 一 小 组 
中 . 
”4 如 果 一 组 人 中 的 每 一 个 都 起 该 组 让 至 少 _- 半 人 的 朋友 ， 册 这 组 人 可 以 国 华 于 一 张 加 
桌 ， 便 每 个 人 都 恰好 华 在 两 个 朋友 之 间 。 


S-3 二 分 本 


许多 作用 于 图 上 的 分 治 算法 都 要 求 在 去 掉 图 的 少量 边 后 ， 能 将 原 轩 分 成 大 小 羔 不 多 的 两 
牛 子 图 。 本 问题 考察 对 树 的 二 分 问题 。 

a. 证 明 : 在 去 掉 含 nn 个 项 扣 的 一 叉 树 中 的 一 条 后 ， 可 以 把 所 有 于 点 分 威 两 个 集合 站 利 
B， 使 得 这 | 区 3n 7 4， 田 | 民 3my7 4。 

b. 通 过 例子 来 说 明 : 在 (al 中 握 到 的 常数 37/ 4 是 最 坏 情 况 下 最 优 的 。 例 如 ， _ 樟 简 音 
棕 在 去 掉 一 条 边 后 所 得 的 大 部 分 平均 划分 的 子 树 都 有 |A| 祥 3n7 4。 

c. 证 明 :， 在 去 挤 至 多 口 【1lzn) 条 边 后 ， 可 以 把 一 棵 有 n 个 顶点 的 树 的 所 有 顶点 分 为 集 
合 A 和 B， 全 得 [nxz24 ,|BI= rn7z2]. 


练 习 五 


. 


5$.1-1 用 疤 必 图 来 说 明 分 配 律 ( 和 ,和 的 第 一 条 式 池 。 
S.1-2 证 明 德 莫 根 律 扩展 到 一 组 有 穷 个 集合 上 时 盛世: 
AA 且 A 站 一 站 A = 入 AU 
AAA AA， = 大 站 Ar 站 : 门 A， 
5.1 一 3+ ”对 等 式 (5.3) 的 扩展 向 以 证 啊 。 该 扩展 被 栎 为 包含 和 排 床 原理: 


愉 ， AUAI 一 
AI+IA+…+IA ， 
一 人 人 AI 用 站 AI 一 … (所 有 的 对 ) 


十 仆 门 A 门 Ai 二 一 (所 有 三 元 组 ) 


+(D ”NA 站 AD 站 人 
5i-~4 证 明 ， 所 有 奇 自 然 数 构 成 的 集合 是 可 教 的 。 
5.1-5 证明: 对 任意 有 穷 集 S， 每 集 3 有 28 个 元 来 ( 即 S 有 28 个 不 同 的 子 集 )。 
5.1-6 通过 将 集合 论 定义 扩展 至 序 对 上 的 方法 求 给 出 一 个 元 组 的 归纳 定义 。 


5.2-1 证 明 : 定义 在 并 的 所 有 子 集 上 的 子 集美 系 " 三 "是 个 半 序 ， 但 木 是 个 全 序 。 

S$.2-2 ”说明 对 任意 正 整数 mn， 关系“ 模 n 等 价 * 是 尾数 集 上 的 等 价 关系 。( 说 a= tb (mod m)， 如 果 存 在 吾 
数 q 使 as-b= qnb。)} 这 个 等 价 关系 把 整数 集 划 分 成 什么 样 的 等 价 类 ? 

5.2-3 ”请 给 出 满足 以 下 性 质 的 关系 ， 

a. 自 反 的 ， 对 称 的 ， 但 不 传递 ， 

bb. 身 反 的 ， 棱 弟 的， 但 不 对 称 ， 

c. 对 称 的 ， 传 递 的 ， 但 不 自 反 。 
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5.2-4 设 & 为 一 有 穷 集 ，R 为 Sxg&8 上 的 一 个 等 价 关系 。 证 明 : 若 对 加 法 运算 R 是 反对 称 的 ， 则 由 及 
产生 的 S 的 等 价 类 都 是 单元 集 。 

5.2-5 有 人 宣称 :如 果 一 个 关系 R 是 对 称 的 、 传 递 的 ， 那 么 它 也 是 自 反 的 。 他 给 出 了 如 下 的 证 明 : 由 
对 称 性 ，aRb 蕴含 bRa， 又 据 传 递 性 ， 导 出 aRa。 这 个 证 明 对 哆 ? 


5.3-1 设 A 和 HB 为 有 穷 集 ， 并 设 人 A -~B 为 一 函数 。 证 二 

8a. 若 了 是 单 射 ， 则 |A| 坟 |Bl: 

b. 若 f 是 满 射 ， 则 | 全 [| 本 |.。 

5.3-2 给 定 函 数 fo9=x+1， 当 其 定义 域 和 陪 域 都 是 N 时 ， 它 是 双 射 吗 ? 当 定 尽 域 和 陪 域 为 Z 时 呢 ? 
5.3-3 请 给 出 一 个 二 元 关系 的 道 的 定义 ， 和 合 当 该 关系 是 个 函数 时 ， 其 道 是 该 函数 的 闭 画 数 。 
5.3-4*+ ”请 给 出 一 个 从 了 工 到 ZxZ 的 双 射 。 


5.4-! 参加 一 个 晚会 的 人 都 也 相手 手 致意 ， 每 个 人 都 记得 他 (或 她 ) 握 了 几 次 手 。 在 晚会 结束 时 ， 主 
人 把 每 个 人 握手 的 次 数 进行 相 加 。 通 过 证 明 气 手 引 理 : 如 果 台 = 人 (V，BE) 是 个 无 向 图 、 则 
3 VEVdegree (y)} 一 2 引 昌 | 

来 说 明 主 人 所 得 的 结果 为 侦 数 . 

5.4-2 证 明 在 一 个 无 向 团 由 ， 回 路 的 长 麻 至 少 是 3。 

5.4-3 证 明 :; 如 果 一 个 有 向 《或 无 向 ) 图 中 包含 一 条 介 于 顶点 吕 和 v 之 得 的 路 径 ， 刚 它 舍 有 -一 条 和 
vY 之 间 的 简单 政 径 。 类 刀 地 证 明 如 果 一 个 有 向 图 省 有 一 个 回路 ， 财 它 售 有 一 个 简单 回路 . 

5.4 一 4 ”证明 : 任意 连通 、 无 向 图 G= (人 (V，E) 都 满足 |Ef>|Y-1. 

5.4-S 验证 : 在 一 个 无 向 图 中 , "可 达 " 关 系 是 该 图 的 顶点 集 上 的 等 价 关 系 。 对 一 个 有 向 图 来 说 ， 等 价 
美 系 的 三 个 性 质 中 的 哪 几 个 对 "可 达 " 关 系 成 立 ? 

5.4 图 52 (ai 中 有 向 图 的 无 癌 图 形式 是 怎样 的 ? 图 5.2 (by 中 无 向 图 的 有 向 图 形式 是 怎样 的 ? 

5.4-7* 证明: 如 果 将 超 图 中 的 关联 美 系 与 二 分 图 中 的 邻接 关系 相对 应 ， 则 超 图 可 用 二 分 图 来 表示 . 
(提示 : 证 二 分 图 的 两 个 顶点 集 食 之 一 对 应 超 图 的 顶点 售 ， 而 让 另 一 顶点 集 与 超 边 对 应 . ) 


5.5-1 请 画 出 包含 顶点 &，B 和 CC 的 所 有 自由 树 : 夯 出 所 有 包含 A，、B 和 和 C， 并 以 六 为 根 的 有 根 
树 ， 杆 出 所 有 包含 A，B 和 C 并 以 人 为 根 的 有 序 树 ; 画 出 所 有 包含 &，B 和 CC 并 以 A 为 根 的 二 叉 树 。 
”5.5-2 .证明 : 对 na>>7， 存 在 包含 n 个 节点 的 站 由 树 ， 使 得 选择 任 一 节点 作 根 就 得 一 榜 不 同 的 有 根 
树 。 

5.5-3 设 G= (VY，E) 为 有 向 非 循环 图 ， 其 中 有 顶点 wEV， 使 得 从 w 至 每 一 个 顶点 vEYV 都 存在 唯 
一 路 径 。 证 明 G 的 无 向 对 应 图 是 一 标 树 ， 

5.5-4 用 归纳 法 证 明 : 二 有 叉 权 中 度数 为 2 的 节点 数 比 叶子 数 小 1。 

5.5-5 用 归纳 法 证 明 : 有 n 个 节点 的 二 叉 机 的 高 度 至 少 为 [ lg nj， 

55-6* 完全 一 六 树 中 的 内 路 径 长 度 是 指 所 有 内 节点 的 深度 之 和 ， 类 似 地 ， 外 耻 径 长 度 是 指 所 有 时节 
点 深度 之 和 。 设 某 标 完 全 二 叉 有 ja 个 内 节点 ， 内 路 径 长 度 为 n， 外 路 径 长 度 为 e。 证 明 e=iH2n。 

5.5-? > 有 们 可 以 对 一 叉烧 了 中 每 个 深度 为 d 的 时节 点 x 早 凡 权 w (9 一 2 证明: 工 人 < 
1， 其 中 和 式 旅 予 T 中 所 有 的 叶 节 点 。{ 该 式 即 及 raft 不 等 式 ) 

558* 证明 : 含有 工 个 叶 节 点 的 二 叉 树 必 包含 一 子 树 ， 其 叶子 数 在 工 /3 和 ZL /3 之 间 《包括 
EL73 和 2L737， 
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第 六 章 “ 计 数 和 概率 


本 章 回 舌 组 合 论 和 概率 论 的 一 些 概念 。 读 者 如 果 对 这 方面 知识 比较 熟悉 ， 可 以 跳 过 开头 
的 一 些 内 容 ， 直 接 去 阅读 后 几 节 。 本 书 的 大 部 分 内 容 都 不 涉及 概率 理论 ， 但 在 有 几 章 中 它们 
是 很 重要 的 。 

6.1 节 简 单 地 介绍 计数 理论 的 成 打 ， 包括 计数 排列 和 组 合 的 一 些 标准 公 \ 式 。 有 关 概 率 论 
的 一 些 基本 事实 和 公理 在 6.2 节 中 给 出 。6.3 节 中 介绍 短 机 变量 和 期 望 、 方 差 的 性 质 。6.4 他 
讨论 二 项 分 布 和 几何 分 布 。 在 6.5 节 中 还 要 进一步 讨论 二 项 分 布 的 “ 尾 " 的 问题 。 最 后 ，6.6 
节 通 过 三 个 例子 来 说 明 如 何 进 行 概率 分 析 。 


6.1 计 数 


计数 理论 要 做 的 就 是 不 对 对 象 进行 校 举 计数 而 回答 “有 驳 少 ”的 问题 。 例 如 ， 我 们 可 能 会 
问 ,“ 有 窗 少 个 不 同 的 nm 位 数 ?" 或 * 有 网 少 种 mn 个 不 同 元 素 的 排序 方法 ?等 等 。 在 这 一 节 中 ， 
我 们 要 介绍 计数 的 基本 内 容 。 其 中 的 一 些 内 容 以 集合 论 为 基础 ， 不 熟悉 的 读者 可 以 先 复习 一 
下 $.1 节 。 


和 规则 与 积 规则 


有 时 ， 欲 奶 以 计数 的 一 些 对 象 可 以 表达 成 几 个 分 离 的 集合 的 并 或 卡 氏 积 。 
和 规则 是 指 从 两 个 分 离 的 集合 中 选取 一 个 元 素 的 方法 数 等 于 两 集合 基数 之 和 。 亦 即 ， 如 
” 果 A 和 昱 是 两 个 没有 公共 元 素 的 有 穷 集 合 ， 则 据 等 式 (5.3) 有 IAL JBI=|AHHBl. 

积 规 则 是 说 从 两 个 集合 中 可 选 的 序 对 数 等 于 可 选 的 第 一 个 元 素数 乘 以 可 选 的 第 二 个 元 素 
数 。 亦 即 ， 如 果 A 和 B 是 两 个 有 穷 集合 ， 则 |Ax Bl=|Al ' [Bl|。 这 就 是 等 式 (5.4)。 


串 


”有 穷 集 $ 上 的 一 个 昌 由 8 的 一 列 元 素 组 成 例如 ， 长 度 为 3 的 串 共有 8 个 :; 
000，001，010，011，100，101，110，111 
有 时 我 们 把 长 度 为 的 串 称 为 k- 串 。 吕 8& 的 子 串 S 是 由 8 中 一 段 连续 的 元 素 组 成 。 一 
个 串 的 - 子 车 是 其 长 度 为 苹 的 和子 串 。 例 如 ，010 是 01101001 的 3 子 串 〈 开 始 于 位 置 4)， 
王 11i 则 不 是 它 的 子 串 。 
集合 $ 上 的 k 一 申 可 被 视 为 上 重卡 氏 积 S- 的 一 个 元 素 ， 则 共有 |S 个 长 度 为 让 的 串 ， 例 
如 ， 二 进 姑 串 共 有 2 个 。 从 直觉 上 来 说 ， 要 在 一 个 含 也 个 元 素 的 集合 上 构造 一 个 kx 绅 ， 
对 第 一 个 元 素 共有 ja 种 选择 ; 对 其 中 每 一 种 ， 我 们 又 可 以 有 种 第 二 个 元 素 的 选择 ; 如 此 
”等 等 。 从 这 种 构造 过 程 就 可 看 出 共有 mn . n…a= 区 个 k- 串 。 


如 |， 


划 


昱 集 上 的 天 排列 的 个 数 为 


排列 


有 穷 集合 S 的 一 个 排列 是 $ 中 所 有 元 素 的 有 订 列 ， 其 中 S 的 每 个 元 素 恰 出 现 一 次 。 例 
如 果 S= fabcl， 则 三 的 排列 共有 后 种 : 
abc，acb，bac，bca，cab，cba。 
对 一 个 售 开 个 元 素 的 集合 来 说 ， 共 有 nl 种 排列 ， 因为 排列 的 第 _- 一 个 元 素 可 有 nm 种 选 
第 二 个 元 素 有 n-i 种 选 法 ， 第 三 个 有 na 种 选 法 ， 等 等 。 
集合 $ 的 一 个 k-- 排 列 是 S 的 大 个 元 素 构成 的 有 序列 ， 序 列 中 每 个 元 素 均 不 相同 。 (这 
一 个 一 般 的 排列 就 是 a 集合 上 的 mh 排列 .) 集合 {fa,bc:dj 上 的 12 个 2 一 排列 为 
ab，ac，ad，ba，be，bd， ca cb， cd da tb 人 


mi 加 
而 - 厅 1 


因为 第 一 个 元 素 有 了 种 取 法 ， 第 二 个 元 素 有 n~1l 各 又 汶 ， 继续 下 去 直到 选 湛 了 上 个 元 


n (nl (na--2) .nk+1D 一 


。 最 后 一 个 元 素 有 nk+Hi 种 取 法 . 


组 合 

n 集 S 的 一 个 k- 组 合 邯 $ 的 一 个 k- 子 集 。 例 如 ， 集合 {avbcdj 有 6 个 2 一 组 合 : 
ab，ac，ad，bc，bd，coqd 

(此 处 我 们 用 了 简化 记号 来 表示 集合 ， 如 ab 表示 {apj， 在 一 个 mn 集中， 可 以 通过 选择 


k 个 不 下 的 直 各 来 科 迁 kx- 组 合 ， 其 数目 可 用 该 mn 集合 的 kx- 排列 数 来 表达 。 对 每 一 个 -给 


， 愉 有 其 元 素 的 kl 个 排列 ， 每 个 都 各 不 相同 。 所 以 ，K- 组 合 数 即 为 z 排 列 数 除 以 Kl ， 


得 (6.1)， 过 个 结 时 是 


和 (6.2) 
KE E KK 1! 
对 k= 0， 这 个 公式 的 含义 即 从 = 集中 选择 个 元 素 的 方式 共 1 种 ， 因 为 0 一 1 
二 项 系数 
我 们 用 记号 (") 来 表示 了 集中 的 kx- 组 合 数 。 根 据 等 式 〈6.2)， 有 : 
1 过 

(= 人 一 kh ! 463) 

这 个 入 式 对 攻 和 mp 一 了 是 对 称 的 : 


(=-() (6 
因为 这 些 数字 出 现在 一 项 展 式 中 的 红 故 ， 它 们 也 补 称 为 一 项 系数: 
e+ "= 工人 (jx (65) 
二 项 展 式 在 x=y = 1 时 的 形式 为 
2"- 工 ( ) (6.6) 


KK 盖 扯 


一 贸 一 


个 


这 个 公式 与 对 28 个 一 进 上 ” 串 中 所 舍 荆 的 个 数 计数 对 应: 共有 人，) 个 二 进 刘 从 信 


1， 因 为 在 串 的 个 位 置 中 选择 上 个 来 区 工 的 方式 共有 (”) 种 : 


关于 二 项 系数 有 很 多 等 式 。 本 节 后 的 练习 中 提供 了 几 个 以 供 读者 证 明 ， 
二 项 界 
有 时 我 们 需要 对 二 项 系数 的 大 小 进行 眼界。 对 1<k<n， 有 下 手 


)= 站 人 一] … Cn 一 上 ) 
k 必 一 1 


-人 全) Ce 
> (a) 67) 
利用 由 Stiring 公 式 (2.12) 导出 的 不 等 式 kl 3 (kej“， 可 得 上 界 为 


( )=a 全 k 十 了) 





近 一 《5.8) 


| 
乓 ( 持 ) (6.9) 
对 所 有 的 0 和 k 和 n， 可 由 归纳 法 (网 练 习 6.1 -- 12) 证 明 有 界 


( < (6.10) 


为 方便 起 见 ， 假 定 0 = 1。 对 k = 1n，0 委 14 志 1， 可 将 此 界 重 写 为 


其 中 


(Us (in) 汪 ( Te DT 入 
-的 GD 
一 20 (6.12) 
HU = -gli- (1 一 和 1 (一 及 (6.13) 


是 《二 项 ) 粒 阴 数 。 同 时 ， 为 方便 起 见 ， 假 设 01g0=0， 这 样 HIO) =HG) =10， 


论 . 


6.2 概 率 


在 分 析 概率 算法 和 随机 算法 时 ， 概 率 是 个 重要 的 工具 .这 一 节 介绍 一 些 基本 的 粮 率 理 


概率 是 用 样本 空间 8 来 定义 的 。 样 本 空间 是 个 集合 ， 其 元 素 称 为 基本 事件 。 每 个 基本 


一 区 一 


事件 都 可 视 为 一 次 试验 的 可 能 结果 。 例 如 ，. 在 抛 两 校 不 同 的 硬币 试验 中 ， 样 本 空间 由 {H， 
T} 上 所 有 可 能 的 2 串 组 成 : 

S={HH，HT，TH，TT} 

一 个 事件 是 样本 空间 $ 的 一 个 子 集 。 例如 ， 在 抛 两 校 硬币 的 试验 中 ， 一 核 面 间 上 另 一 
枚 面 朝 下 的 事件 为 TBT，THJ.。: -事件 $ 称 为 必然 事件 ， 而 事件 号 称 为 空 事件 。 如 果 两 个 事 
件 A 门 B= 下 ， 则 称 这 两 个 事件 是 互 斥 的 。 有 时 ， 我 们 把 基本 事件 sk 8 当 作 事件 {sj。 根 据 
定义 可 知 ， 所 有 的 基本 事件 都 是 互 斥 的 。 


概率 公理 


样本 空间 S$ 上 的 一 个 概率 分 布 Pr 是 从 S 的 事件 到 实数 的 一 个 喘 并 满足 以 下 的 概 
率 公 理 : 
LPr{A}>>0， 对 任意 事件 A 成 立 。 
2.PrfS} = 1。 
3.PrfAljB}=PrfA}+PrfB}，A、B 为 任意 两 个 互 太 事件 。 更 一 般 地 ， 对 任何 〈 有 
穷 或 可 列 无 穷 个 ) 两 两 互 斥 的 事件 序列 A，Az，…， 有 
Pr UA| 一 之 Pr(Ai 


称 Er 为 事件 A 的 概率 。 
由 上 面 的 公理 和 一 些 基 本 的 集合 理论 ( 见 S$.1 节 ) 可 得 到 几 个 结果 。 室 事 件 各 的 概率 
为 Pr{@} = 0。 如 果 AEB， 则 PrfA] 乏 Pr{B}。 用 A 表示 事件 S 一 A(A 的 补 ) ， 有 Pr{A} 
一 1 一 Pr{A}+。 对 两 个 事件 A 和 阳 ， 
PrfAfWB =PrfA} 二 PrfBl 一 PrfA 门 B (6.17) 
入 PrfAiy +PrfB)} (6.18) 
在 摧 硬币 的 试验 中 ， 假定 四 个 基本 事件 中 每 一个 扑 梳 守 部 是 1 则 至 少 有 一 一 面 癌 上 
的 概率 为 
Pr{HB，HT，TH}= putprtHmaprtrHj= 37《4  . 
还 可 以 这 样 考 虑 ， 面向 上 的 硬币 数 小 于 ! 的 概率 为 PrtTTJ 174， 因此 ， 至 少 有 一 面 
疝 上 的 概率 为 1-17 4=37 4。 


离散 概率 分 布 


如 果 一 个 概率 分 布 是 定义 在 有 穷 或 可 列 无 穷 样本 空间 上 的 话 ， 就 称 之 为 离散 的 概率 分 
布 。 设 $ 为 样本 空间 ， 则 对 任何 事件 A， 四 
PrfAy = Prfy 


这 是 因为 基本 事件 (无 其 是 A 中 的 ) 是 互 斥 的 。 如 果 S 是 有 穷 的 , 量 每 个 基本 事件 sC8 
有 概率 


性 


Prts}=17 和 | 
则 得 S 上 的 一 致 概率 分 布 。 这 种 情况 下 的 试验 常 被 称 为 “随机 地 选择 S 中 的 元 素 "。 
作为 一 个 例子 ， 考虑 钢 一 和 而 的 过 程 。 这 种 硬币 的 正面 朝 上 和 反面 朝 上 的 概率 都 为 


172。 如 果 抛 硬币 ma 次 ， 则 有 在 样本 空间 S= {H，Tin 上 的 一 致 概率 分 布 。8 中 的 每 个 基本 
事件 可 以 用 {H，T} 上 的 长 度 为 n 的 串 来 表示 ; 其 发 生 的 概率 为 1/ 2"。 事 件 

A={ 内 好 有 个 正面 向 上 ，nrk 个 反面 商 上 发 生 } 
是 8 的 子 集 ， 大 小 为 AI= 【小 因为 TH，T} 上 共有 ( ，) 个 n 申 答 食 有 个 本 。 这 样 


事件 A 的 概率 为 Pr{A)} = ( )72 
连续 一 致 概率 分 布 


在 连续 一 概率 分 布 中 ， 样 本 空间 的 所 有 子 集 是 不 被 看 作 事件 的 。 这 种 分 布 定义 在 一 个 实 
数 闭 区 间 [a，b] 上 ,其 中 a<b。 我 们 希 刻 区 间 [a，tb] 上 的 每 一 点 都 是 等 可 能 的 。 但 该 区 间 上 有 
不 可 数 的 点 ， 如 果 我 们 给 每 个 点 以 相同 有 穷 的 、 正 的 概率 值 ， 则 就 不 能 同时 满足 公理 2 和 公 
理 3。 出 于 这 个 原因 ， 我 们 仅 赋 给 $ 的 某 些 子 集 以 概率 值 ， 使 公理 能 对 这 些 事 件 成 立 。 

对 任意 闭 区间 [c，d]， 其 中 a<ce<d<cb， 连 续 一 致 概率 分 布 定义 事 件 [c， d] 的 概率 为 


Prt[c， 二 = 钴 一 


注意 对 任意 一 个 点 x= 一 区 ， 对 ， 其 概率 为 0。 如果 去 掉 闭 区 间 [c， 熙 的 两 个 端点 ， 则 有 开 
区 间 (c， 由 。 因 为 fc，d 电 =[c，qU) (c 由 rIda，d]j， 据 公理 3 有 Pr{t[c，d]}= Prtkc， 
djj。 一 般 来 讲 ， 连 续 一 致 概率 分 布 的 事件 集 是 la， 匡 的 子 集 ， 可 以 通过 开 、 闭 区 间 的 有 限 或 
可 数 并 集 得 到 。 : 


条 件 概 率 和 独立 性 


有 时 候 ， 我 们 对 某 个 试验 的 结果 会 有 一 些 先 验 的 知识 。 例 如， 如 果 殷 两 枚 过 匀 和 硬币， 且 
至 少 其 中 的 一 枚 正面 向 上 ， 那 么 两 次 正面 都 朝 上 的 概率 是 多 大 ? 已 知 的 知识 排除 了 两 个 反面 
朝 上 的 可 能 性 ， 另 外 三 种 基本 事件 是 等 可 能 的 ， 可 认为 各 自发 生 的 概率 为 1 / 3。 又 因为 只 
有 一 个 事件 是 两 个 正面 朝 上 ， 故 答案 是 17 3.。 

条 件 概率 是 对 这 种 先 验 知识 思想 的 形式 化 。 在 事件 日 发生 的 条 件 下 ， 事件 A 发 生 的 条 
件 概率 定义 为 


Pr AiB} = 





Pr A 人 3B} 
PdA ， (6.19) 
其 中 人 从 直觉 上 说 , 因为 我 们 知道 事件 B 已 发 生 , 所 以 A 也 发 生 的 事件 应 是 . 
A 门 B。 即 ，A 契 B 是 事件 A 和 了 翌 都 发 生 的 结果 所 构成 的 集合。 因为 任 一 结果 也 是 了 B 中 的 一 
个 基本 事件 ， 因 此 为 对 所 有 3 中 基本 事件 概率 加 以 规范 化 ， 可 以 用 Pr[B} 来 除 它们 ， 使 它们 
的 和 为 1。 这样， 在 B 发 生 的 前 提 下 A 的 条 件 概率 就 是 事件 A 门 B 的 概率 与 事件 B 的 概率 
的 比值 。 在 上 曾 的 例子 中 ，A 是 两 枚 硬币 的 正面 都 朝 上 的 事件 ，B 是 至 少 有 一 枚 的 正面 向 上 
的 事件 ， 条 性 概率 为 Pr{AIB}= (174 7 (7 和 =173， 
” 两 个 事件 是 独立 的 ， 如 果 
PrfAB=PrfAyprfB 
该 式 在 Pr{B} 关 0 时 等 价 于 
PrAIB+=PrA} 


看 一 个 例子 : .很 定 犯 了 两 枚 均匀 硬币 ， 其 结果 是 独立 的 ， 则 两 外 正面 亢 上 的 概率 为 “. 
(17Z2) (17Z2) =174。 再 假设 一 个 事件 是 第 一 枚 硬币 正面 向 上 ， 另 一 事件 是 两 枚 硬币 朝 . 
上 的 面 不 相同 。 这 两 个 事件 分 别 发 生 的 概率 都 是 17 2 这 两 个 事件 同时 发 生 的 概率 是 
17/ 4。 根 据 事件 独立 性 的 定义 ， 这 两 个 事件 是 独立 的 (或 许 有 的 读者 会 认为 两 个 事件 都 依赖 
于 第 一 枚 硬币 的 情况 .) 最 后 ， 假 设 两 枚 硬币 被 焊 在 一 起 ， 这 样 在 抛 的 时 候 它们 上 能 同时 正 
面 朝 上 或 相反 。 这 两 种 情况 是 等 横 率 的 ， 这 样 每 个 硬币 都 是 正面 向 上 的 概率 为 1/ 2， 但 它 
们 同时 正面 向 上 的 概率 为 17 2s# (人 172 (172)。 由 此 可 知 ， 一 枚 硬币 正面 朝 上 的 事件 和 
其 他 硬币 正面 朝 上 的 事件 不 是 相互 独立 的 。 

称 一 组 事件 Al，A:，…，A。 是 两 两 独立 的 ， 如 果 

PrtAi 门 Ai 一 PrfAJPrA 

对 isi<j<n 成 立 。 称 它们 是 《相互 ) 独立 的 ， 如 果 对 2<K<a，l<il<i<…<i< 

nk- 子 集 A， ，A， ，…， Ai 满足 
PrfA; 门 A， 门 …… 生 A， 1 = REA， jPrtA， }…PrfA; } 

例如 在 掀 两 枚 均匀 视 币 的 试验 中 ， 设 A，, 为 第 一 枚 硬币 正面 朝 上 的 事件 ，A， 为 第 二 枚 

正面 朝 上 的 事件 ，A， 为 两 枚 硬币 朝 上 的 面 不 同 的 事件 ， 有 : 


Pr{A =172 
PrfA,}=172 
Pr{A =172 


PrftA 门 A =174 
PrA 门 Aj=174 
PrftA 门 A=174 
Pr{A 门 A :站 A 人 = 
因为 对 1<i<js 和 3， 有 PrfAi 们 Aj = PrIAJPrtA = 一 174， 所 以 事件 A,，A， 
积 A, 是 两 两 独立 的 ， 但 不 是 互相 独立 的 ， 因 为 PrfA,f 人 A， 门 A,，} 
=0，BPrfA,jPrtA,jPrtA =178 关 0。 


志 
中 叶 斯 定理 
由 条 件 概率 的 定义 〈6.19) 可 知 对 两 个 具有 非 零 概率 的 事件 A 和 B， 有 : 
PrfA 门 B!= PrfB}PrfAlB) (6.20) 
一 PrfAjPrfBIA} 
对 上 式 作 个 变换 ,让 ,p BiA) 
十 
Prf AI 了 一 PrB 《6.21) 


这 就 是 贝 叶 斯 定理 ， 该 式 的 分 母 Pr{B} 是 个 规范 化 因子 ， 可 以 用 另 一 种 方式 加 以 表达 。 因 
为 B= (B 站 AU OGA ， 又 BA 和 BA 是 相互 独立 的 事件 ， 则 
PrfB} = Pr{fB 站 Al + PrfB 门 A} 
一 了 2 一 


一 PrfAjPrfBIA1 + PrfAiPrfBIA} 
代 人 等 式 〈6:21) ， 得 贝 叶 斯 定理 的 等 价 形式 : 
PrfAj}Prf BA} 
PrtAB} 一 站 [ATEEBIA 下 PMATETBIAI 
让 叶 斯 定理 可 用 来 简化 对 条 件 概 率 药 计算 。 例 如 ， 人 和 假设 我 们 有 一 核 均匀 硬币 和 一 校 不 均 
匀 硬 和 责 ， 后 者 在 藩 下 时 总 是 正面 向 上 。 我 们 来 做 一 个 由 三 个 独立 事件 组 成 的 试验 : 随机 选择 
两 校 获 币 中 的 一 枚 ， 将 该 硬币 扼 起 一 次 ， 再 抽 一 次 。 假 设 两 次 抛 起 的 结果 都 是 正面 朝 上 ， 则 
该 硬币 是 非 均 匀 的 概率 有 多 大 ? 
现在 用 贝 叶 斯 定理 来 解 这 个 问题 。 设 A 为 非 均 匀 硬 币 被 选择 的 事件 ，BB 为 抛 起 两 次 都 
是 正面 朝 上 的 事件 。 现 要 求 出 Pr{AIB}j.。 因为 PrIA1=172，PrfBIA}= 1， PrfA3 =17 和 站 


BA 和 以 
EAIB} = (7 有 17 (072 I++ 《7 人 (7 和) 


一 475 
6.3 离散 随机 变量 


一 个 《离散 》 随机 变量 X 是 一 个 从 有 穷 的 或 可 数 无 穷 的 样本 空间 到 实数 集 上 的 晒 数 ， 
它 对 一 个 试验 的 每 种 可 能 结果 都 赋予 一 个 实数 值 。 这 样 ， 就 可 对 这 些 值 作 概 率 分 布 分 析 。 随 
机 变量 也 可 定义 在 不 可 数 无 穷 的 样本 空间 上 ， 但 会 引起 一 些 困难 。 因 而 ， 我 们 将 恨 定 随机 变 
重 是 离散 的 。 

对 随机 变量 X 和 实数 定义 事件 居 =x 为 {sES: 和 (3) = 难 ， 这 样 ， 


Pr X= 寻 一 工 PrfS} 


asS: 天 妇 到 对 
函数 
f (〔x) -Pr(X= X} 
是 随机 变量 X 的 福 率 密度 攻 数 。 根据 概率 公理 ， Pr{X 一 xz>0，》 Pr{X 一 | 1。 
下 面 来 看 一 个 掷 一 对 普通 的 六 面 仍 子 的 试验 。 这 个 试验 的 样本 空间 中 有 36 个 可 能 的 基 
本 事件 。 假 设 其 概率 分 布 是 一 致 的 ， 即 每 个 基本 事件 sES 是 等 可 能 的 ; Prts}j=17 36。 现 
定义 随机 变量 X 为 掷 册 的 两 个 骨 子 值 中 的 较 大 者 。 例 如 , Pr{X=3j=S736, 因为 把 数值 3 
研 给 了 36 个 可 能 的 基本 事件 中 的 5 代 即 (1,3) ，(2,3) ，(3,3) ，(3,2) 和 (3,1)。 
几 个 随机 变量 定义 在 同一 个 样本 空间 上 的 情况 也 是 很 常见 的 。 如 果 X 和 下 是 两 个 随机 
变量 ， 冰 数 
f (X，y) 一 Pr{X=x， 立 = 一半 
称 为 和 和 Y 的 联合 概率 密度 函数 。 对 固定 的 y 
PrY 一 州 一 PrX=x， 一 中 ， 


类 伏地 ， 对 固定 的 x 


Pr{X= 对 一休 Pr{X=x 阅 一 凡 


一 73 一 


利用 条 件 概率 的 定义 《6.19] ， 有 
FPC 立 = 好 
一 天 
我 们 说 随机 量 六 和 也 是 独立 罗 如 果 对 所 有 X 和 了 事件 X= 克 六 = y 是 独立 的 ， 
或 等 价 地 ， 如 果 对 所 有 大 和 Y， 有 Pr{X=x， 立 = 由 =PrfX=xjPrfY 二 分 
给 定 在 局 一 样本 空间 上 定义 的 一 组 随机 变量 ， 我 们 可 以 通过 对 它们 求 和 、 求 积 ， 或 作用 
其 他 函数 来 定义 新 的 随机 变量 ， 


随机 变量 的 期 望 值 


一 个 随机 变量 的 分 布 可 以 简单 地 总 结 为 它 所 能 取 的 各 个 慎 的 “平均 值 *。 一 个 离散 的 随机 
变量 居 的 期 望 值 《也 叫 期 望 或 中 数 ) 为 : 


E[X] = >xPrfX 一 X} [6.23) 


该 式 在 等 导 右 边 的 和 式 为 有 限 或 绝对 收 伍 时 有 定义 。 有 时 也 用 jx 来 表示 蕊 的 期 望 值 ， 在 
于 下 文 很 明确 时 ， 可 简单 地 写作 凡 。 
现在 来 看 一 个 拓 两 核 均 匀 硬 币 的 游戏 ， 每 出 现 一 个 正面 (用 再 表示 ) 朝 上 得 3 分， 出 现 一 
个 反面 (用 工 表示 ) 天 上 则 失 2 分 。 用 随机 变量 洋 求 代表 得 分 ， 其 期 望 是 
-EIXI=6- Prf2H}H+1 PrfIHE，1LT 一 4 Prf2T} 
=6 (474) + (72 一 4 (17 4 
一 1 
两 个 随机 变量 和 的 期 望 等 于 它们 的 期 望 的 和 和 ， 即 
EIX+Y]=EIXHRIY] {6.24) 
这 个 性 质 可 以 扩充 到 期 望 的 有 限 或 绝对 收 敏 的 和 式 上 。 
如 果 X 为 任意 随机 变量 ， 函 数 g (xj) 就 定义 了 新 的 随机 变量 g (X)。 若 g 人 (X) 有 定 
交 ， 册 
E[g(CX 一 之 SOPrX 一 台 


设 gg9=ax'a 为 任意 各 量 , 则 有 


Pr X 一 XIY 一 录 一 


E[axJ= aE[X] (6.25) 
由 此 可 知 ， 期 望 是 线性 的 ， 对 随机 变 委 X，Y 和 常数 a， 有 
E[aX-Hy} 一 aE[X]HBE[Y] 【6.26) 


当 两 个 随机 变量 尺 和 立 是 独立 的 ， 且 它们 的 期 望都 有 定义 时 
EIXY]= xyPr(X 一 X，Y 一 信 


一 和 XYPrX 一 xjPrY=y 


(Segajl sy 
一 Epdery 


一 了 4 一 


一 般 地 ， 当 n 个 随机 变量 X ，X,，…，X 互相 独立 时 ， 有 : 

EX 和 … 刁 一 了 IX]EIX]…EIX，] (6.27) 
当 一 个 随机 变量 的 取 值 为 自然 数 时 ， 关 于 它 的 期 望 有 一 个 很 好 的 公式 : 

EDXI= ZiPrfX -= 


一 下 (Pr > 二 一 Pr{X 关 i++1) 


1 咕 必 


一 了 Pr{X 《6.28) 


+t=1 


在 和 式 中 ， 每 项 PrfX2> 计 被 加 i 次 ， 被 减 去 记 1 次 〈PrfX2>0t 除 外 )。 
方差 和 标准 差 


一 个 期 望 为 BX] 的 随机 变量 X 的 方差 为 
Var[X]= EX 一 E[XD9 
=E[X- 一 2XE[XHETX] 
一 EEX9--2E[XE[X]]+HS2[XI] 
一 了 [X]-2E3X]HE3X] 
一 五 区 人 -ED (6.29) 
等 式 E[E'XJ= E?[X] 和 BEIXE[X]]= E2[X] 成 立 是 因为 EIX] 不 是 一 个 随机 变量 ， 只 是 一 个 
实数 ， 这 样 就 可 应 用 等 式 (6.25) (此 时 a= EIX]7。 我 们 还 可 有 蛋 写 式 (6.29) 以 得 到 一 个 随 
机 变量 的 平方 的 期 望 的 表达 式 : 
E[X]= Var[X]HE3[X] (6.30) 
随机 变量 和 的 方差 与 aX 的 方差 的 关系 为 : 四 
War[aX] 一 a2war[X] 
X 和 习 为 独立 随机 变量 ， 
Var[X+Y]=Var[X]HTVat[fY1 
一 般 地 ， 如 果 工 个 随机 变 基 藉 |，X2，…，X,， 是 两 两 狼 立 的 ， 则 有 : 


Var| 2 入 | - 世 Var[X] 本 《6.31) 


1 一 


一 个 随机 变量 买 的 标准 差 是 X 的 方差 的 【 正 的 ) 于 方 恨 ， 可 以 用 0x 或 来 表示 。 利 用 
这 个 记号 ，X 的 方差 也 可 表示 成 r 


6.4 几何 分 布 与 二 项 分 布 


我 们 前 面 常 引 为 例子 的 搬 硬 币 是 伯 努 利 试验 的 一 个 典型 的 例子 。 这 种 试验 有 两 种 可 能 的 
结果 : 成 功 ， 其 概率 为 bp; 失败 ， 其 概率 为 q= !-p。 当 我 们 说 到 伯 努 刺 试验 时 ， 是 指 各 次 
试验 都 是 互相 独立 的 ， 且 每 次 成 功 的 概率 都 是 p。 由 伯 努 利 试验 可 引出 两 类 重要 的 分 布 : 几 
何 分 布 与 二 项 分 布 。 


几何 分 布 


假设 我 们 在 做 一 系列 的 伯 努 利 试验 ， 每 次 成 功 的 概率 为 p， 失 败 的 概率 为 q= 1-p。 在 
获得 成 功 之 前 要 做 多 少 次 试验 ? 设 随 机 变量 X 表示 获得 成 功 之 前 的 试验 次 数 ， 则 XXX 的 取 值 
范围 为 {1，.2，…}。 另 外 ， 对 >1， 有 : 

.Pr{ 以 一 寻 一 ge 《6.33) 
这 是 六 为 在 获得 一 次 成 功 之 前 已 失败 了 k-1 次 . 满足 方程 (6.33) 的 概率 分 布 称 为 几何 分 
布 。 图 6.1 示 出 了 该 分 布 的 期 望 为 17P=3. 
假设 P<1， 利 用 等 式 (3.6) 可 计算 出 几何 分 布 的 期 记 为 


E[X-= 研 kqxp 


《6.34) 


此 





图 6.1 成功 概率 为 p=173， 拓 败 概率 为 q= 1-p 的 一 个 几何 分 布 


据 此 可 知 ， 在 取得 一 次 成 功 之 前 平均 要 做 17 P 次 试验 这 个 结果 与 我 们 的 直觉 比较 符 
。 另 外 ， 我 们 可 以 类 似 地 计算 方差 : 

Var =qy (人 .35) 
现在 来 看 一 个 例子 ; 假设 我 们 在 反复 近 两 个 仙子， 直到 出 现 一 个 了 点 或 11 点 。 在 所 有 


一 蚤 一 


可 能 的 36 种 结果 中 ， 有 :6 种 是 7 了 点，2 种 是 11 点 。 因 而， 成 功 的 概率 为 
p=8736=279; 我 们 在 成 功 前 平均 要 抒 17p=972=4.5 次 ， 


二 项 分 布 


| 可 能 成 功 多 少 次 ? 人 则 它 的 取舍 范 
围 为 ，1，…，Tn。 对 k= 0，…，D， 有 


Prf {X= 一 攻 } = 人 pq 《6.36) 
因为 共有 ( “) 种 方式 来 决定 n 次 试验 中 的 哪 k 次 是 成 功 的 ， 每 一 种 的 概率 都 


是 六 qd 。 满 足 等 式 〈6.36) 的 概率 分 布 称 为 二 项 分 布 。 为 方便 起 见 ， 我 们 用 以 下 记 呈 来 
谎 示 二 项 分 布 族 : 


b (xi n，D] = 人 je (一 p) "… 0 
和 ) 
人 


册 志 瞻 了 
5 二 


ET 








图 6.2 一 个 二 项 分 布 


图 6.2 中 给 出 了 由 mn=15 次 伯 努 利 试验 得 出 的 一 个 二 项 分 布 b 华 : 1$，173)， 其 中 每 
一 次 试验 成 功 的 构 率 为 p= 17 3。 该 分 布 的 期 望 为 ap=5。 另 外 ， 这 种 分 布 之 所 以 叫 * 一 项 ” 
分 布 , 是 因为 《6.37) 是 (p+qj 的 展开 式 的 第 k 项 。 又 因为 ptqg=]1， 故 有 


>》b(kin p =1 (6.38) 
这 正如 概率 公理 2 所 要 求 的 一 样 。 


利用 等 式 (6.14) 和 【6.38) ， 我 们 相 以 求 出 符合 二 项 分 布 的 随机 变量 的 期 望 值 。 设 
为 遵从 一 项 分 布 b (ki n，、?p) 的 随机 变量 ， 并 设 q= 1-P。 根 据 期 望 的 定 尽 ， 有 : 
E[X] = 之 Jb (ki mn，Db) 


-per 


Sn 一 1 
-mpZ| BR 1 gP 
ke=1 1 长 一 ] 
nm 一 上 
一 
上 一 必用 | 


了 一 直 


一 hp 之 btk 一] pb) 


一 mp (6.39) 

如 果 我 们 利用 期 望 的 线性 性 质 (6.26)， 可 以 得 到 间 样 的 结果 ， 而 所 敌 的 代数 运算 则 要 少 

得 多 。 设 Xi 是 撒 述 第 i 次 试验 中 成 功 次 数 的 随机 变量 ， 则 有 ELXi=p 1+qg :0=p。 又 由 
(6.26) ， n 次 试验 中 成 功 次 数 的 期 望 值 为 : 


E[X] 一 下 Zx = zx]- >p=mp 
. 还 可 采用 同样 的 方法 来 计算 这 种 分 布 的 方 郑 。 利 用 等 式 - (6.29) ， 有 Var[X,] = E[X;] 
一 E 区 ]。 因 为 i 仅 取 值 0 和 1， 有 E[IXi= EIX,]= p， 则 


VariXi] 一 p 一 p” 一 D9q (6.40) 
为 计算 站 的 方差 ， 我 们 可 以 利用 mn 次 试验 的 独立 上 性 ， 根 据 式 (6.31) ， 有 
Var[ 区 ] 一 “zx | - 2 Var[X ， ]= >pa- 一 npq- (6.41) 


一 项 分 布 bD (ki nn，D) 的 特点 就 像 我 们 在 图 6.2 中 看 到 的 那样 ， 它 在 帮 从 0 到 nm 时 不 
断 增 加 ， 直 到 达到 中 数 np， 然后 开始 下 降 ， 通过 一 项 分 布 中 连续 两 项 的 比值 就 可 以 看 出 这 
种 分 布 始终 呈现 上 述 的 变化 趋势 : ， 
kk 忆 一 攻 
_b 引 ; 筷 ， p) (pa 


b' 发 一 1 nn，P) ( k 一 La-k+1 ， 
了 hb 得 
下 一 上 


al kk-D1i oo-k+Dip 
kl tn 一 kt 1 nl dgq 
_ nn 一 KK 十 起 


在 .42 
RE (6.42) 


当 (n+1) pk 为 正 数 时 该 比值 大 于 1。 这 样 ， 对 攻 < (np+1D) p， 有 b (km， P) >hb 
(k-1 mn，Pp) 《此 时 分 布 是 增加 的 ); 对 > (n+Dl) P, 有 b (Ki n，p) <b (k-1 mn， 
p) 【此 时 分 布 是 下 降 的 )。 如 果 k= (n+1) p 是 个 整数 ， 则 b (Km p)》 一 b 《kk 一 1 hn， 
p)， 因 而 该 分 布 有 二 个 极 大 值 : 在 kz= (nt pb 处 和 k-1= (n+l) p-1=np-q 处 的 值 。 
否则 ， 该 分 布 就 在 np-q<k< (nt bp 中 唯一 的 整数 值 k 处 取得 最 大 值 ， : 

以 下 引 理 给 出 了 二 项 分 布 的 一 个 上 界 。 

引 理 61 设 n>>0、0<p<1，q= 1-p，o<<k<cn， 有 : 


一 鹤 一 


b (ki nb 芭 (里 ) (2 


证 明 :- 利用 等 式 (6.10) ， 有 : 
Oo 人 GD 人 


.6.5 二 项 分 布 的 尾 








”对 每 次 成 功 的 轰 率 为 的 hn 次 伯 努 利 试验 ， 我 们 更 感 兴趣 的 常 带 是 其 中 董 少 (或 董 
多 ) 有 k 次 成 功 的 概率 ， 而 不 是 惟有 k 次 成 功 的 概率 。 在 这 一 节 中 ， 我 们 要 讨论 二 项 分 布 
的 尾 的 问题 : 即 二 项 分 布 btki; na，P) 中 远离 中 数 np 的 两 段 区 城 。 我 们 还 将 给 出 尾 的 斤 个 
重要 的 界 。 

首先 我 们 将 给 出 分 布 b(k; nm，P) 的 右 尾 的 界 ， 关 于 左 属 的 异 可 以 通过 其 倒 成 功 和 失败 
的 作用 来 决定 。 

定理 6.2 考虑 n 次 伯 努 利 试验 的 一 个 序列 ， 每 次 试验 的 成 功 概率 为 P。 讽 买 为 表示 总 
的 成 功 次 数 的 随机 变量 ， 则 对 0c ksn， 至 少 成 功 k 次 的 概率 为 


PrfX 关 ki 一 3 b (人 mn，b) 


< ( 
: 利用 不 等 式 (6.15) 


(< 


Pr 和 2 一 bn， DB) 


卫 一 卜 


一 2b 人 {k 十 节 th， 虽 


Z( jp 轩 一 pa 人 站 


) 
jp bb (na 一 K，P) 
) 


一 79 一 


为 了 bf n 一 k， p) =1 ( 据 等 式 (638) ) 。 


下 面 的 推论 给 出 了 二 项 分 布 的 左 尾 的 界 。 一 般 地 ， 我 们 将 把 从 上 下 文中 判断 左 尾 或 右 尾 
的 工作 留 给 读者 去 做 。 
推论 6.3 考虑 一 列 次 伯 努 利 坛 验 ， 每 次 试验 成 功 的 概率 为 P。 如 果 用 随机 变量 X 来 
表示 总 的 成 功 次 数 ， 则 对 0<k<n， 至 多 成 功 次 的 机 率 为 


PC 和 革 一 btGi D， 六) 


上 一 册 


-() oo- 
证 明 同 右 尾 药 情 况 . - 
我 们 下 一 个 要 给 出 的 是 二 项 分 布 的 左 尾 的 又 一 个 界 。 下 面 定 理 告 诉 我 们 ， 在 远离 中 数 
处 ， 左 尾部 分 的 成 功 次 数 是 呈 指 数 式 地 减少 的 
定理 6.4 考虑 一 列 次 伯 努 利 ， 每 必 试 验 成 功 的 概率 为 pB， 失 数 的 概率 为 q= 1-p。 设 、 
和 是 表示 总 的 成 功 次 数 的 随机 变量 。 对 0<k<np， 成 功 数 小 于 次 的 概率 为 


PY{fX <k = Z， (3 mn， 妖 ) 
kq 
np 一 
证 明 : 用 第 3.2 节 中 介绍 的 技术 ， 我 们 可 以 用 一 个 几何 级 数 来 对 级 数 宁 - 
限 异 。 对 ii= 1，2，…，， 据 等 式 ， (6.42) 有 : 


bi 一 nn pb) _ 
bi mn，Db) 人 一 i 十 1 P 


< (二 全 ) 
< 人 


如 果 设 x= ( -一 儿 (3 ) < 1 则 有 





二 人 Pb (kk; mn， 有 了 ) 


btGi 三 ， Db) 


1 








了 一 长 
bG 一 1 0n，p) <Xb (人 3，P) ， 有 二 1< 太 
经 过 选 代 ， 又 有 


二 -1 


> bfis n。，P) << Zr bfk; nb)} 


< btki n，D) 了 


; mL P) 





-au n，PDP) 


当 <np72 时 ， 有 kq/v (np 一 k) 福 1， 其 舍 义 是 b(k，bn，Dp) 约束 了 所 有 小 于 k 的 项 
的 和 。 现 在 来 三 一 个 扫 工 枚 均匀 厂 币 的 试验 。 取 pp 一 17 2，k=a7 4， 定理 6.4 告诉 我 们 : 
出 现 少 于 ny4 次 正面 的 概率 小 于 恰 出 现 a74 次 正面 的 概率 . 更 进一步 ， 对 任意 rz 之 4， 出 
现 的 正面 次 数 少 于 ayxr 的 概率 小 于 怡 出 现 axr 次 正面 的 概率 。 把 定理 6.4 与 引 理 6.1 等 缚 
合 起 来 用 会 得 到 一 些 很 有 用 的 结果 . 

类 人 地 ， 可 给 出 关于 右 尾 的 另 一 个 界 。 

推论 6 考虑 一 列 立 次 伯 努 利 试验 ， 每 次 试验 成 功 的 概率 为 p。 设 随 机 变量 X 表示 总 
的 成 功 殿 数 。 对 np <<m， 和 煞 于 攻 次 成 功 的 概率 为 


Pr{X> 一 了 bi 也 ， D) 


一 业 二 ] 


(一 攻 ) Pb 
必 Kap T 和 (区 


”下 一 个 定理 也 是 针对 nm 次 伯 努 利 试验 ， 每 次 成 功 的 概率 为 m，i= 1，2，…，n。 我 们 可 
通过 对 每 次 试验 取 世 =pb 来 给 出 二 项 分 布 的 右 尾 的 一 个 界 。 
定理 66 考虑 Ra 次 伯 努 利 试验 ， 在 第 i 次 试验 中 《i= 1，2，…，D)， 成 功 的 概率 为 
Pi， 失败 的 概率 为 和 =1-- 记 。 设 随机 变量 和 表示 总 的 成 功 次 数 ， 并 设 A= HEX]， 
太一 Var[X]。 则 对 rz>0， 有 
Pr{X 一 上 > 吓 么 e 
证 明 : 因为 对 任意 <>0， 函数 ee 关于 x 严格 递增 ， 所 以 
Pr{X 一 A 呈 一 Prfe en 
其 中 wx 要 稍 后 才能 确定 。 利 用 Matkov 不 等 式 (6.32)} 得 : 
PrfX 一 A 下 和 忒 Ele" je (6.43) 
证 明 的 主要 部 分 是 对 Ele" “ ” ] 限界 ， 并 用 合适 的 值 来 蔡 换 (6.43) 中 的 wx。 我 们 先 来 
证 明 一 个 有 用 的 界 : 对 0<bs1l，q=1 一 P 
pe ”十 ge ”所 ea {6.44) 
其 中 0 <x < 1 为 证 明 这 个 界 ， 可 引用 不 等 式 (2.8) : 
二 二 时 扫 1 十 科 十 区 
”该 式 对 咯 私 1 成 立 ， 因 和 而 
pe%q% +qe sp(itoadq+ (wxqgj ) +q( 一 ap+ (ap) ”) 
=1+ax (pq +p q) 


甩 ， 妃 ) 


一 呈 4 


一 1+c pq 

er m9 

现在 来 求 Ele” 2 ”]、 对 i= 1，2，…，a， 设 XI 为 随机 变量 ， 如 果 第 i 次 伯 努 利 试验 
成 功 它 取 1， 失 败 取 0。 这 样 


一 81 -一 


对 = 也 茯 
上 


天 一 丰 = 洛 《下 一 书 ) 
用 它 来 代 X 一 u， 得 : 


Ele” 慌 一 由 ] = EIIIe 一 Bi ] 


四 TITEfe* ou -em ] ， 


1=1 


由 〈6.27) 就 可 得 这 个 结果 ， 欠 为 各 随机 变量 Xi 的 相互 独立 性 草 含 了 随机 变 
量 e* “的 相互 独 立 性 〈 见 练习 6.3 一 和 。 根 据 期 望 的 定义 可 有 : 


衬 《一 Pi 《一 中 】 
王 忆 - 


]=e 
一 pe +qe 
<e" pq ( 据 不 等 式 (6.44) ) 
由 此 得 : 


EPe" (区 一 髓 ] = He 区 9i 


3 之 
加 
一 避 


这 是 因为 据 等 式 (6.31) 和 〈6.40) ， 有 o = 工 ，p,q,。 在 这 个 结果 的 基础 上 ， 再 据 不 等 
Pr{ 和 一 站 减员 所 ee 9 (6.45) 
取 x=r/2c ( 兄 练 习 6.5 一 6) ， 得 : 
Pr[{X 一 A> 呈 去 e tv 26213 262 一 (rr252) 
鄙人 2 
一 日 
一 
本 定理 在 应 用 到 伯 努 利 试验 时 ， 因 为 每 次 试验 成 功 的 概率 都 为 bp， 可 得 到 下 面 的 二 项 分 
布 右 尾 的 界 。 
推论 6.7 考 虐 一 列 nm 次 伯 努 利 试验 ， 每 人 成 功 的 概率 为 P， 失 败 的 概率 汶 q= {t-p。 对 
rz0， 有 : ， ， 
PrtX 一 np 六 呈 一 > bk mn，D) 


= fmp+rl 

3 
一 fdnbaq 
六 吕 


证 明 : 对 二 项 分 布 ， 等 式 (6.39) 和 (6.41) 昔 合 
kz 一 习 [X]=np， 史 =Var[X=npq 


6.6 ”概率 分 析 


这 一 节 通 给 三 个 例子 来 介绍 概率 分 析 。 第 一 个 例子 是 有 关 在 一 间 房 间 里 的 k 个 人 中 的 
某 一 对 有 相同 生日 的 概率 的 ; 第 二 个 例子 讨论 随机 地 将 球 投 到 盒子 里 去 的 问题 ; 第 三 个 例子 
讨论 的 是 抛 硬币 试验 中 出 现 一 连 串 正面 朝 上 的 情况 . 


-661 生日 悖 论 、 


一 个 可 以 用 来 说 明 概 率 分 析 的 很 好 的 例子 就 是 古 得 的 生 归 悖 论 . 一 个 房间 里 的 人 数 要 达 
到 多 少 才 有 可 能 使 其 中 的 两 人 有 相同 的 生日 ? 这 个 问题 的 答案 小 得 有 点 让 人 吃惊 。 我 们 下 面 
将 看 到 ， 所 出 更 的 眉 论 就 在 于 这 个 数目 比 一 年 中 的 天 数 要 小 得 多 。 

为 回答 这 个 问题 ， 我 们 先 用 整数 1，2，…，k 人 k 是 房间 里 的 总 人 数 ) 对 房间 里 的 人 编 
号 。 另 外 ， 我 们 也 不 考虑 周年 的 情况 。 对 i= 1，2，…，k， 设 bp 表示 ji 的 生日 ， 且 1Kb< 
n。 同 时 我 们 还 假设 备 人 的 生日 均匀 分 布 于 一 年 的 口 天 里 ， 因 而 妖 {bi= 叶 =17 na，i=1， 
2，…， 日 。 

两 个 人 i 和 j 的 生日 正好 相同 的 概率 依赖 于 所 做 出 关于 生日 的 随机 选择 是 否 是 独立 的 。 
如 果 生 日 是 独立 的 ， 册 1 和 j 的 生日 都 落 在 日 期 rz 上 的 概率 为 

Prfbi=r， = 起 = Prfbi=rPrfb = 中 = 1 

这 样 ， 他 们 的 生日 蓝 在 同一 天 上 的 概率 为 

Prfbi,=b}= 了 Prfb=m bi= 了 


F 一 上 


- 一 1] 7n 
也 就 是 说 ， 一 但 选 定 b ，bj 与 bi 相同 的 概率 为 1 Zn。 因而 ，i 和 j 有 相同 生日 的 概率 
与 他 们 中 的 一 个 的 生日 落 在 某 一 天 上 的 概率 相同 。 要 注意 的 是 ， 这 种 一 致 性 是 直接 依赖 于 
各 人 的 生日 是 独立 的 这 个 假设 的 。 
我 们 可 以 通过 考察 一 个 事件 的 补 的 办 法 来 分 析 'k 个 人 中 至 少 有 两 人 有 相同 生日 的 概 
率 。 具体 地 ， 雄 少 有 两 个 人 生日 相间 的 概率 等 于 1 减 去 所 有 人 的 生日 均 不 相同 的 概率 后 一 
事件 可 表示 为 


- 芷 一 | 


B = 咎 A， 
其 中 A 是 指 对 所 有 jsi， 《+ 1) 与 有 不 同 的 生日 这 一 事件 。 亦 即 
Ai 一 [bi 关 bj: jl 2 ，…，* 计 
因为 可 将 B , 写 为 B ,一 上， Ce ， 据 等 式 〈6.20) 可 得 表 归 式 
PrfB =PrB PrtA， 了 B，} (6.46) 


其 初始 条 件 为 Pr{B,} = 1。 换 言 之 不 相同 的 概率 等 于 b ,b,，…,b，， 不 相同 的 


谍 率 匀 上 在 bb，…'b。， 不 同 的 条 件 下 bb, 拓 b， 的 概率 ， 此 处 ji 1.2,- -小 一 
如 果 刷 ，b,，…，b， ,不同 ， 条 件 概率 bz#b (i=1, 2,…, k-1) 为 (n 一 基 
+ 17a) ， 这 是 因为 天 中 有 一 信 一 D) 天 没 被 占用 。 通 过 对 递归 式 《6.46) 作 迁 代 ，， 
可 得 : 
pr(B } - PrfB ,jpPrfA,IB,}PrfA 四,} -PrfA， 了 } 


人 -人生 
-aa 0- 


又 根据 不 等 式 (2.7) : 1 了 xsex， 有 


一 1b 一 了 AZ ” 一 必 一 1 ， 
PrfB se ee 





上 一 1 . 
一 e 一 工 - 1 1 


~ 上 帮 一 及 Z2 
一 怠 
肥 172 . 


当 --k(k-D7Z 2n<ln(l73 时 成 立 。 当 k 个 生日 均 不 同 的 概率 竺 多 为 17 2,. 这 时 
《kr-1D >>2nli2， 或 者 解 二 次 方程 得 k> (1+V1+ (8mn2) nj 7 2。 对 =365， 要 有 > 
23。 根 据 这 个 结果 可 知 ， 如 果 一 个 房间 里 至 少 有 23 人 ， 则 至 少 有 两 个 人 生日 相同 的 概率 至 
少 是 172。 在 火星 上 ， 一 年 有 669 个 火星 日 ， 这 样 就 要 有 31 个 火星 人 才能 有 同样 的 效果 。 


另 一 种 分 析 方 法 


我 们 可 以 利用 期 望 的 线性 性 质 〈 等 式 《6.26) 来 给 出 一 个 关于 生日 收 论 的 更 简单 而 近似 


的 分 析 。 对 房间 时 的 k 个 人 中 的 每 一 对 人 人 让 ，1<i<j<k, 定义 随机 变量 Xi 如 下 : 
X， -{ 如 果 i 和 j 的 生日 相同 


否则 
因为 两 个 人 有 相同 的 生日 的 概率 为 1 / na， 根据 期 望 的 定义 〈6.23) ， 有 ， 
EX 一 1 《1 nl 二 0 tt 一 i7m) 
一 1a 
根据 【6.24) ， 具有 相同 生 昌 的 两 个 人 的 双子 数 就 等 于 每 “对 的 前 的 和 ， 后 者 如 下 : 


E 一 上 


ZEpei- ( , 


kk 在 一 日 
2 
这 样 ， 当 k (kx-1) >>2n 时 ， 期 望 的 对 子 数 至 少 是 1。 如 果 房 间 里 至 少 有 V2n 人 个人， 就 
能 断定 至 少 有 两 人 的 生日 相同 。 对 n=365$， 如 果 攻 =28， 具 有 相同 生日 的 人 的 对 子 数 的 期 
望 值 为 (28 - 27) / (2 . 365) %1.0356。 那 么 ， 如 果 至 少 有 28 个 人 ， 则 可 期 望 至 少 有 一 
对 人 的 生日 相同 。 在 火星 上 则 要 至 少 38 个 火星 人 才能 达到 同样 效果 . 
上 述 的 两 种 分 析 中 ， 第 一 种 给 出 了 为 使 至 少 存在 一 对 人 生日 相同 的 概率 超过 172 所 需 


的 人 数 ， 第 一 种 分 析 给 出 了 所 期望 的 相同 生日 数 为 1 时 的 人 数 ， 虽然 两 各 情况 下 人 数 不 同 ， 
但 从 渐 近 意义 上 说 它们 是 一 样 的 ， 部 是 BC 


6.6.2 球 与 盒子 


现在 让 我 们 来 看 这 样 一 个 过 程 : 把 数 个 相同 的 球 随机 地 投 到 编导 为 1，2，…，b 的 
个 盒子 中 去 : 每 次 投掷 是 独立 的 ， 所 投 的 球 等 可 能 地 蓝 到 任 一 个 盒子 中 去 ， 即 概率 为 
E7b。 我 们 可 以 把 投球 过 程 看 作 是 一 组 伯 努 利 试验 ， 每 次 成 功 的 概率 为 17b。 此 处 成 巧 是 
指 球 落 到 给 定 的 盒子 中 。 关 于 这 个 过 程 可 以 提出 许多 有 趣 的 问题 ; 

: 有 多 少 球 落 在 给 定 的 盒子 里 ? 落 在 给 定 的 盒子 里 的 球 数 遵从 二 项 分 布 b (ki 
17Z 蕊 。 如 果 投 m 个 球 ， 则 期 望 的 球 数 为 nyb。 

- 在 一 个 给 定 的 盒子 中 有 球 之 前 ， 平 均 要 投 多 少 次? 要 投 的 次 数 遵 从 儿 何 分 布 ， 概 率 为 
1b， 期 望 值 为 1/ (17b) =h， 

- 在 给 定 的 盒子 里 至 少 有 一 个 球 之 前 ; 要 投 多 少 次 ?我 们 称 在 次 投 迫 中 球 落 到 空 信子 
中 为 “ 击 中 "， 现 在 要 知道 的 是 为 得 到 b 次 击 中 所 鲜 的 平均 投 丘 数 n。 

根据 击 中 数 可 以 把 nm 次 投球 分 面 儿 个 阶段 。 第 i 个 阶段 包括 从 第 (i-H 次 击 中 到 i 次 击 
中 之 问 的 投 括 。 第 一 阶段 包含 第 一 次 投掷 ， 因 为 第 一 次 投球 时 所 有 盒子 都 是 空 的 ， 肯 定 是 一 
次 击 中 。 对 第 i 阶段 中 的 每 一 侈 投掷 ， 有 记 1 个 合子 中 有 球 ，、b-_i+1 个 盒子 基 空 的 。 这 样 ， 
对 第 i 阶 侦 中 的 所 有 投掷 ， 得 到 一 次 击 中 的 概率 为 〈b-i+1) /hb。 

设 m 表示 第 i 阶段 中 的 投掷 数 。 为 得 到 b 次 击 中 所 需 的 投掷 数 为 a= 二 ， n; 。 每 个 随 
机 变量 都 服从 几何 分 布 ， 成 功 的 概率 为 〔b-i 计 切 /b。 其 期 望 为 : 

Emj-5iTT 
根据 期 望 的 线性 性 质 ， 有 : 


-2 


一 之 Emi] 


hb 


-YY_b 
一 之 1 一 iT 


=-b2i 
<sb (nb+oO (D ) 


最 后 一 行 是 根据 调和 级 数 的 界 (3.5) 得 来 的 . 这 个 结果 告诉 我 们 ， 在 每 个 盖子 都 有 一 
个 球 之 前 ， 大 约 要 投 blnb 次 。 


-和 6.3 序列 


设想 做 抽 一 核 均匀 硬币 n 次 的 试验 。 我 们 所 衣 期 望 看 到 的 最 长 的 连续 正面 的 序列 有 多 
长 ? 答案 是 @(lg 区 。 分 析 如 下 。 


首先 证 明 最 长 的 出 更 正面 的 序 剂 的 期 望 长 并 为 DC; 设 Ai 为 这 样 一 个 事件 : 长 度 
至 少 为 上 的 正面 的 序列 开始 于 第 i 次 抛掷 ， 或 更 准确 好,， 事 件 上 次 连续 的 硬币 抛掷 i， 计 1， 
…，i 这 k-1 得 到 的 潮 是 正面 。 此 处 1<k<n，j<i<n-k+1。 对 任 一 给 定 的 事件 Ak， 全 部 K ， 
次 抛 括 都 出 现 正面 的 概率 服从 几何 分 布 ， PP=qr 172 


Pr{A_ 7 人 4 
对 =2 flgn 1 
PTA， 四 
ET 
=1Txn 


由 此 晤 抑 ， 长 度 至 少 为 [2 培 j 的 一 个 正面 的 序列 开始 于 位 置 ; 的 概率 是 很 小 的 ， 特别 
是 考虑 到 序列 开始 的 可 能 位 置 至 多 只 有 nm 《实际 上 只 有 0 [1 上。 长 度 至 少 为 [2 也 
na 的 正面 的 序列 出 现在 任 一 位 置 士 | 的 概率 为 


Pr U An 1 


La | 

因为 由 布尔 不 等 式 《622)， 一 组 事件 的 并 的 概率 至 多 是 各 个 束 件 概率 之 和 ， (注意 即 使 
对 不 独立 的 事件 布尔 不 等 式 也 成 立 .)  ， 

据 上 述 结 果 可 知 ， 长 度 至 少 为 2 [ga 1 的 一 个 序 殉 的 概率 至 多 为 1/ 车 最 长 序列 的 
长 度 小 于 2 Tlgn 1， 则 概率 至 消 为 1 -17Za。 因为 每 个 序列 的 长 度 至 多 为 因此 最 长 序列 
的 期 望 长 度 的 界 为 四 四 

(2 Flgn1) (I-tzo An (xn -0 《1gm) 
一 个 正面 的 序列 的 长 度 超过 r 「 lgn 1 的 机 会 随 着 rz 而 很 快 地 减少 。 对 [>1， 峙 T「]g 


n 个 臣 译 构 成 的 序列 开始 于 位 置 j 的 概率 为 
Pr[A 一 172 


过 17nar 
这 禅 ， 最 长 的 序列 至 少 长 r TIga ] 的 概率 就 至 多 是 nm 一 1 或 等 从 地， 最 长 序 
综 的 长 度 小 二 FTlga ] 的 概率 至 少 为 -1 一 nm 
看 一 个 例子 ， 对 na= 1000 次 硬币 抠 掷 ， 出 现 一 系列 最 少 为 2 Flga 1.= 20 次 正面 的 概率 ， 
此 多 是 17 n=17y 1000。 出 现 长 庆 超 站 3 T mn1=30 的 正面 序列 的 概率 至 多 为 
和 :=171000'000， 
我 们 再 来 证 明 一 个 下 界 : 在 掀 n 次 硬币 试验 中 ， 最 长 的 正面 序列 的 期 望 长 度 为 D 〈1 
。 为 证 明 这 个 界 ， 外 长 度 为 lg Dj /2 的 序列 .。 由 等 式 〈6.47) 可 得 : 
PrfA =172 
>17ZYVa 
因而 ， 长 度 至 少 为 1 地 划 /2 的 正面 序列 不 始 于 位 置 i 的 概率 至 多 是 1-1/Va .我们 
可 以 把 硬币 的 mn 次 揭 掷 分 为 至 少 1 2607 1 地 组， 每 组 包含 1 nl _ 72 次 连续 的 挑 
P， 衬 改 这 些 组 由 开 尿 县 独立 的 各 次 硬币 扼 塘 形成 的 ; 售 其 中 桂 何 一 组 不 是 长 度 为 lgnjw2 


记 地 nj ”2 





的 广 生 为 
= 风 如 17Vn) mm 


捷 
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，， 
本 委 7 mn 
在 上 面 的 推导 中 ， 用 到 了 不 等 式 (2.7): lf+x<<er， 和 事实 : (2n7 lgmD /Van 地 
mn，a2>2。 (对 nm= 1， 每 组 都 不 是 一 个 序列 的 概率 至 多 为 1/n=l.) ， 
由 上 而 结果 可 知 ， 最 长 的 序列 超过 1 lgnj 2 的 概率 至 少 是 1-17n。 因 为 最 长 序列 
的 长 度 至 少 为 0， 其 期 望 长 度 为 
(Lem 2 (1 Hzoa =Qllgnm 


思 考 题 


6 一 球 和 全 于 


在 这 个 同 是 中 ， 我 们 来 考察 关于 把 a 个 球 投入 个 不 同 的 人 子 的 种 种 方法 的 一 一 些 候 
设 . 

a: 假 定 n 个 球 是 不 同 的 ， 它们 在 同一 个 合子 中 的 次 序 无 关 紧 要 。 话 证 :, 把 所 有 的 球 放 人 
合子 中 的 方法 共有 bp 种 

 b. 息 设备 球 均 不 相同 ， 在 同一 合子 里 的 球 按 序 排列 。 证 明 : 把 球 放 到 盒子 里 去 的 方法 共 
有 (b+tn~D! 7/ 《6-bD! 种 : (提示 : 考虑 在 一 排 了 个 不 同 的 球 和 b-1 根 可 区 别 的 棍子 中 
可 能 有 的 安排 方法 .) 

c. 假 设 每 个 球 都 是 相同 的 ， 这 样 它们 在 一 个 仿 子 中 的 次 序 就 无 关 紧 亡 证 明 : 把 球 放 入 


全 了 时 共 有 (”“， ] 种 (在 上 -个 小 由 中， 才 夫 如 和 个 对 相同 话 人 和 
少 种 重复 的 安排 ?) 

d 假设 每 个 妹 都 相同 ， 且 流 有 一 个 信子 多 许 有 多 于 一 个 的 于 证 明 ; 把 球 放 到 各 信子 里 
去 的 方法 共有 {“) 种 - 四 

. 地 四 

很 役 各 球 相同 ， 且 任何 金子 都 不 允许 为 空 。 证 明 ; 放 球 的 方法 有 ( 。 ) 种 。 
6_2 对 max 程序 的 分 析 
下 面 的 程序 的 作用 是 确定 一 无 序数 组 AI1. oj] 中 的 最 大 元 素 : 


1 Iaxs 一 一 _ 
2 for is-l to 有 


3 do 从 将 上 A 团 与 maax 比较 
4 证 A 国 > max 


5 then Imax<- 和 A[ 

现在 来 对 第 5 行 中 所 执行 的 赋值 的 平均 次 数 做 个 分 析 。 人 假设 A 中 的 数 随 机 地 取 自 区 间 
[0， 口 . 

a. 刘 有 果 数 x 随机 地 选 自 一 个 由 妾 个 不 则 的 数 构 成 的 集合 ， 则 x 为 该 集合 中 最 大 数 的 概率 
有 客 大 ? 

b. 当 执行 程序 中 的 第 5 行 时 ， 对 1<jsi，AD 与 A 外 之 岂 的 关系 笃 样 ? 

c. 对 1<ic<n 中 的 每 个 ji， 第 5 行 被 执行 的 概率 有 儿 大? 

d. 设 s，s:，…，8sn 为 于 个 随机 变量 ， 其 中 5i 表示 第 1 次 循环 中 第 $ 行 执行 的 次 数 (0 
误 1)， 则 E[sj 是 案 少 ? 
e- 设 S=SI+S+…+s 是 该 程序 的 一 次 运行 中 第 $ 行 被 执行 的 总 次 数 。 证 明 : Elsl=@ 
lgn) 


和 -3 雇用 问题 
某 教 授 想 和 雇用 一 个 新 的 助 研 。 她 已 安排 了 和 m 个 应 试 者 的 面试 ， 准 备 根据 他 们 的 条 件 


作出 选择 。 不 幸 的 是 ， 怒 所 在 的 大 学 规定 在 每 次 会 面 后 她 都 必须 立即 决定 是 取 还 是 不 权 。 

教授 于 是 决定 采用 这 样 的 策略 : 选 一 个 正 整数 k>nh， 先 面试 并 拒绝 前 X 个 庶 试 者 ， 然 
后 选择 第 --- 个 其 条 件 优 于 前 面 各 人 的 应 试 者 。 车 条 人 忻 最 好 的 是 在 前 丰 个 人 中 ， 则 选择 第 n 
个 人 。 证明: 当 上 k 取 约 为 ae 时 ， 数 授 能 选 到 最 好 的 助 研 希望 最 大 ， 其 值 约 为 17e。 


6-4 概率 计数 


用 一 个 t 伺 的 计数 器 我 们 一般 只 能 计数 到 2 一 1， 而 用 R.Morris 的 概率 计数 法 ， 则 可 计 
到 一 个 大 得 多 的 值 ， 但 代价 是 精度 有 所 损失 . 

对 i=0，1，…，2~1， 我 们 约定 计数 器 中 的 值 i 表示 计数 m， 且 各 mi 构成 了 一 个 非 负 
数 的 递增 序列 。 假 设计 数 器 的 初 值 为 0， 代表 计 数 由 =0。 作 用 于 计数 器 上 的 INCRE- 
MENT 操作 包含 一 个 概率 值 1。 如 果 i=2-1， 则 报告 训 绸 错误; 否则 ， 计 数 器 以 概率 
17 (niasi-ni) 增加 1， 而 其 不 变 的 概 雍 为 1~17 (ni 一 m)]， 

如 果 我 们 选择 m=i ii 之 0， 则 该 计数 器 就 是 一 个 普通 的 计数 器 。 如 果 我 们 选择 mn = 入 
(i>0)， 或 m=Fi 《第 i 个 非 波 那 韶 数 ， 见 2.2 节 )， 则 会 出 现 一 些 硼 趣 的 情况 ， 

对 这 个 问题 ， 假 设 nxw_i 已 足够 大 而 使 得 溢出 错误 发 生 的 概率 可 以 忽略 。 

a. 证 明 :; 在 执行 了 n 次 INCREMENT 操作 后 ， 计 数 器 所 代表 的 数 的 期 望 值 众 是 n。 

b. 对 由 计数 器 所 表示 的 计数 的 方差 的 分 析 覃 依赖 于 ni 的 序列 。 让 我 们 来 看 一 个 简单 傅 
况 : 对 所 有 i0，n=100i。 在 执行 了 pn 次 INCREMEMNT 操作 后 ， 计 数 帮 所 代表 的 数 的 方 
差 是 多 少 ? 


练 习 六 
11 一 个 m 昌 电 有 多 少 个 k 子 串 ? 〈 由 不 同位 置 开 始 的 全 等 子 串 在 这 首 砍 为 不 同 .) nm 串 中 共有 于 


少 全 子 审 ? 
6.1-2 mn 输 和 人、m 输出 的 布尔 函数 是 个 由 {TRUE，FALSEj" 到 {TRUE，FALSEJjm 的 函数 。 共 有 多 


少 个 输 人 ，1 输出 的 布尔 函数 ? 共有 多 少 个 a 个 输入 、m 个 输出 的 布尔 函数 ? 
6.1-3 fm 个 全 坐 一 张 圆桌 的 方式 共有 多 少 种 ? 如 果 一 种 坐 法 可 让 另 一 种 坐 法 旋转 而 得 的 话 ， 则 丁 者 
视 为 相同 
6.1-4 现 要 从 和 集合 11，2，…，100} 中 取 三 个 不 同 的 数 ， 使 其 和 为 偶数 。 共 有 多 少 种 选 法 ? 
站- 一 $ 证 明 等 式 


(.) -号 (6.14) 


对 0<FKk 所 n 成 立 ， 
6.1 一 6 证 明 等 式 


(= ( 





”对 0< 飞 过 ma 成 立 。 


6. 一 了 要 从 习 个 物体 中 选 出 X 个 ， 可 以 先 将 其 中 基 一 个 标记 为 与 其 他 的 不 同 。 在 选择 时 可 以 以 该 物 
栖 是 否 鹤 选择 了 来 作 判 断 。 用 这 种 方法 证 骨 : 


OO 

6 一 8 利用 练习 6.41 一 7 的 结果 ， 对 m = 0， 1，…，6 和 0<ksn 时 的 二 项 系数 { ) 造 一 张 表 ， 其 
中 (在 第 一 行 ，(_) 和 ( ) 在 下 一 行 ， 以 此 燃 推 ， 由 - :项 系数 构成 的 这 张 胡 称 为 Pascal 三 佣 形 . 

6.1 一 9 证 明 ; Zi-( ) 


6561 一 10 证 明 : 对 9 关 人 0< 委 ks 拓 m， ( 的 最 大 值 在 k=1L nZ24 或 k= rn7 2 1 时 取得 。 
6 一 1t*+ 对 n 关 加 j 基 站 《20 j+K<Ssn 不 等 式 


(Js 人 (6 


荐 否 成 站? 
6.1 一 12* 对 KK sny2 用 归纳 法 证 明 不 等 式 (6.10), 并 利用 等 式 (6.4) 将 其 扩 详 到 对 所 有 Kk 么 n 成 立 。 
61 一 13* 利用 Stirliag 近 亿 公 式 来 证 明 : 


了 。 
( )= (1E+OULzm ) (6.16) 
四 亚 己 


6.1-14* ”通过 对 炉 函 数 H0N 微分 来 证 明 它 在 4=172 时 取得 最 大 值 。、HILZ 327 具 址 是 什么 值 ? 


- . “ 
6.2-1 证 明 布 尔 不 等 式 : 对 任意 有 穷 或 可 数 无 穷 的 事件 序列 A:，A:，…， 有 


PrfA 放 JA 久 大 <Pr[A HPr[Aa+… | (6.22] 
6.2-2 某 个 人 在 抛 -一 校 均匀 硬币 ， 另 一 个 人 在 抛 两 枚 硬币 ， 前 者 的 试验 中 正面 向 上 上 的 情况 比 后 者 多 的 
概率 有 骆 大 ? 


6.2- 3 现 有 一 选 牌 共 10 张 ， 每 张 上 都 有 一 个 从 1 到 10 中 的 不 同 数 字 。 在 许 过 这 和 揭 牌 后 每 次 使 掉 三 
张 。 选 出 的 三 张 牌 旺 递 增 序 的 概率 多 大 ? 
62-4* ， 现 有 一 枚 不 均匀 硬币 。 每 区 抽 超 时 正面 朝 汪 的 概率 为 (未知 量 ) P，0<P<1。 说明 如 何 通过 
济 多 次 该 硬币 来 模 失 抛 一 校 均匀 的 硬币 ? 
6.2-5 * “请 给 出 这 样 一 个 过 程 ， 使 之 以 两 个 整数 a 和 日 (0<a<b) 为 输入 ， 并 踪 过 扼 均 色 硬 币 ， 产 
生 的 输出 中 正面 向 上 的 概率 为 avb， 反 面向 上 的 概率 为 〈b-a) xb。 另 给 出 期 望 的 抛 硬币 次 数 的 界 . 
6.2-6- 证 明 : PrfAlB} +PrfAAIB} = 1 
6.2-7 了 证 明 : 对 任意 一 组 事件 Ai，A:，…， 生 。 


一 89 一 


PrtA 站 As 门 一 门 Ad= Pr[A] PrfA 用] Pr[AiAN 门 A…PrfA LA， 门 A: 门 …… 门 A 1。 

6.2-8* 说 明 如 何 来 构造 一 快 个 事件 的 集合 ， 使 得 所 有 事件 两 两 独立 ， 但 该 集合 的 任 -一 一 个 k>2 的 了 
集中 的 事件 都 不 是 孔 相 独 立 的 ， 

6.2-9* 给 定 事件 C， 两 个 事件 A 和 B 是 条 件 独 立 的 。 如 果 

PrfA 六 BlICi =PrfA|C Pr[BIC} 

请 给 出 两 个 不 独立 但 在 给 定 第 三 个 说 伴 下 条 件 独立 的 事件 的 例子 。 

6.2-10* ”有 这 样 一 个 游戏 ， 奖 品 被 汶 在 三 个 窗帘 之 一 的 后 面 、 如 果 找 准 了 那个 窗帘 ， 就 能 获得 奖 
唱 。 在 先 定 了 某 一 个 但 还 没有 揭 开 它 之 前 ， 游 戏 的 主持 人 揭 开 另 两 个 窗帘 中 的 一 个 ， 发 觉 盒子 是 空 的 ， 了 他 
就 问 是 否 愿 意 换 另 一 个 剩 下 的 窗帘 。 如 果 换 的 话 ， 获 奖 的 机 会 会 如 何 改变 ? 

52-11* 某 监狱 的 典 狱 长 从 三 个 犯人 中 随机 地 选 一 个 炎 放 ， 另 两 个 则 被 处 决 。 卫 兵 知 道 谁 将 被 帮 
放 ， 但 又 不 允许 告诉 任何 一 个 犯人 。 设 三 个 犯人 为 X，Y，Z。 犯 大 和 私下 里 问 阅 和 了 工 中 谁 将 被 处 决 ， 并 
说 他 已 知道 他 们 中 至 少 有 一 个 要 死 掉 ， 卫 兵 痪 需 透 圳 有关 和 自己 的 命运 。 卫 兵 告诉 居 说 立 要 被 处 决 。 现 
在 和 比 先前 乐观 了 ， 因 为 他 估计 他 或 工 将 被 释放 ， 即 他 获得 自由 的 概率 为 17 2。 请 说 明 他 这 个 佑 计 对 否 ? 
或 仍然 是 17 33 
6.3-1 在 掷 两 个 届 子 的 试验 中 ， 两 个 愉 子 点 数 的 和 的 期 望 是 什么 ?两 个 骨 于 点 数 的 最 天 值 的 期 望 是 什 
人 么 2 加 

6.3-2 数组 A[1..n] 中 包含 a 个 不 同 的 随机 排列 的 数 。 这 nm 个 数 的 每 一 种 排 询 是 等 可 能 的 。 问 数组 中 最 
大 元 素 的 下 标的 期 望 是 多 少 ?对 于 最 小 元 素 呢 ? 

6.3-3 有 一 种 游戏 是 播 动 有 三 个 如 子 的 盒子， 游戏 者 可 在 1 到 6 的 六 个 数 中 的 任 一 个 上 押 一 元 钱 .在 
播 动 盒子 后 ， 结 果 是 这 样 的 : 如 果 三 个 骨 上 的 点 没有 一 个 与 游戏 者 抑 的 相同 ， 则 他 的 一 元 钱 就 输 岳 了 : 
反之 ， 如 果 他 所 押 的 点 正好 出 现在 个 盘子 上 人 = 1，2，3)， 他 保留 他 的 一 元 钱 ， 并 要 赢 回 元 ， 他 在 玩 
一 次 这 种 游戏 中 所 能 期 望 的 获 利 是 多 少 ? 

63-4 设 X 和 Y 为 独立 的 随机 变量 。 证 明 对 任意 函数 f 和 g，f (X]) 和 g (Y) 是 独立 的 . 

6.3-5 设 X 为 一 非 负 的 随机 变量 ， 并 假设 E[ 芭 是 良 定义 的 。 证 明 Markov 不 等 式 : 


Pr X2ti< EX 《6.32) 
对 所 有 t>0 成 立 ， 
6.3-6* 设 S 为 一 样本 空间 ，X 和 为 随机 变量 ， 且 X (sj >>X' (时 ]，sES。 证 明 对 任意 实 党 量 上 
有 
Pr{ 区 > 时 22PrfX >t} 


6.3 一 7 在 一 个 随机 变量 的 平方 的 期 望 和 该 随机 变量 期 望 的 平方 中 ， 师 一 个 更 大 ? 
6.3-8 证明: 对 任意 一 个 只 取 旭 和 1 的 随机 变量 X， 有 : YarfX]= E[XJEFI--X]， 
16.3-9 ”根据 方 益 的 定 广 6.29)， 评 肌 : 小 

VaraM- “VarfX] 


6.4~1 对 几何 分 布 验证 概率 公理 2 

6.4-2 在 抛 六 枚 均匀 硬币 的 试验 中 ， 在 出 现 三 次 正面 向 上 和 三 站 面向 上 之 前 要 扫 几 次 ? 

6.4-3 证 明 : b 全; nh，P) =b 位 - 卡 : n，g， 其 中 可 =p， 

6.4-4 评 明 : 二 项 分 布 的 最 大 值 大 约 是 17V2rnpqd。 其 中 1 一 PP。 

6.4-35* 证明 在 ma 次 伯 淄 利 试 骆 《等 次 成 功 的 概率 2 -Zn 中 没有 有 成功 的 概率 的 为 1ye 只 有 -- 
次 成 功 的 概率 也 大 约 为 17 e。 

6.4-6*+ 某 人 抛 一 校 均 匀 硬 市 na 次， 另 一 个 人 世 同 样 做 . 证 岩 机 们 得 到 同 禅 的 正面 向 上 的 次 数 的 概率 


为 ( /4 。 另 外 ， 请 验证 等 式 


ZJ = 人 () 
-6647 证明: 对 OKccn，b (ki da，172) < 福 28H 全 [有 习 
其 中 五 (x 是 精 画 数 《6.13)。 有 
54-8w 考虑 次 伯 嗓 利 试 验 ， 对 i= 1， 2 :mn， 第 ji 次 成 功 的 概率 为 ai。 另 设 和 是 天 示 总 的 成 屿 
次 数 的 随机 变量 ， 县 PPpi，i= 1，2，…a。 证 明 对 1<k<n， 
Br{ 其 < 萎 } 去 3b {2 下，T) 


6.4-9 * 设 A 为 包 当 次 伯 努 利 试验 的 舍 合 ， 其 中 每 一 次 成 功 的 概率 为 记 。 用 谓 机 变 最 X 表示 了 次 
试验 中 总 的 成 功 次 数 ;X 为 表示 另 一 个 由 半 次 伯 努 利 试验 构成 的 集合 A' 中 总 的 成 荔 次 才 ， X* 中 每 次 试验 成 
蕊 的 概率 为 ,>>Pi。 和 证 明 : 对 DGkcn 

PrfX PPrfX2>k 
(提示 ; 考虑 如 何 才能 利用 A 中 的 试验 来 得 到 Ar 中 的 试验 ， 可 利用 练 台 6.3_6 的 结果 .) 


6.5-1 * 再 有 两 个 情 癌 : 扩 一 校 均 匀 葬 币 半 交 而 注 有 出 现 一 次 正面 诊 寺 ;将 该 天 丙 扫 4n 狂 而 出 更 少 
于 旦 次 的 正面 同上 。 这 两 种 情况 嫩 个 的 可 能 性 更 小 些 ? 
6.52 3 证 更: 


一 


吕 ， k 
Z( ) < (十 1 KR GT {: aa fta+1l) ) 


站 
对 所 有 a > 0，0 < 大 <na 成 立 。 
在 5 一 3 证明; 如 毕 0 < 丰 <bp，D<bp<1，g=1 一 PP， 有 : 


Ze < 


.6.5 一 4 证明: 定理 6.6 的 条 件 蓝 售 著 Prli X3> 叶 近 e 天 ， 类 伏地， 推论 6.7 的 杂 件 蕴 会 
著 Frfnp 一 X 关 Is 7 
6.5 一 5 考虑 一 列 次 伯 努 利 试验 ， 在 第 i 次 试验 中 (i = 1， 2，…。mj) ， 成 劲 的 概率 为 pb ， 失 败 的 
概率 为 9 = 1 一 P 。 说 随机 变量 X 表示 成 功 的 名 次数 ，# ~ BEIX 证 明 ; 对 r> 0， 有 : 
Pr{ 基 一 由 六 半生 e 7 人 
6.5 一 6w 证 明 : 不 等 式 (6.45) 的 右 式 在 we 一 zy 2 时 到 得 最 小 值 。 


6.6-1 假设 把 所 有 的 球 投 到 b 个 盆子 里 去 ， 每 一 次 投掷 痢 是 独立 的 ， 且 一 个 球 投 到 任 一 个 盘子 里 的 机 
会 都 是 相同 的 。 在 其 中 有 一 个 合子 里 至 漠 有 两 个 球 之 前 要 投球 次 数 的 期 请 值 是 多 少 ? 

6.6-2 * 在 生日 起 论 的 分 析 中 ， 各 生日 是 否 要 互 斥 ? 或 外 要 两 两 独立 就 够 了 ? 证 明 自己 的 答案 。 

6.6-3 * 在 一 个 生日 晚会 上 ， 若 要 使 有 三 个 人 的 生日 相册 具有 可 能 性 ， 则 要 遵 请 多 少 人 ? 

6.6-4 * ”一 个 在 大 小 为 上 的 集合 上 的 k- 串 实际 上 是 个 K 排列 的 概率 有 多 大 ? 这 个 问题 与 生日 休 论 有 
无 联系 ? ， 
6.6-5 * ” 候 设 有 nm 个 球 被 投 到 mn 个 盒子 里 去 ， 每 次 投掷 都 是 独立 的 ; 球 被 等 可 能 地 投 到 任 一 个 仿 子 
中 去 。 投 完了 后 余下 的 空 售 子 数 的 期 望 值 是 多 少 ? 恰 有 一 个 球 的 盒子 数 的 期 望 值 是 多少 ? 
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第 二 篇 ”排序 和 顺序 统计 学 


这 一 部 分 将 给 出 几 个 解决 以 下 排 摩 问题 的 算法 : 
输 人 : mn 个 数 <ai， 遇 39 ai> 的 一 个 序列 


和 输出: 输入 序列 的 一 个 重 排 <a ，a. 


2 性 中 委员 过 … 去 有 
本 卫 所 


输入 序列 是 一 个 有 a 个 元 素 的 数组 ， 但 可 能 以 其 他 形式 来 表示 ， 如 链 衣 等 。 
输入 数据 的 结构 


在 实际 中 ，、 待 排序 的 数 很 少 是 单个 的 值 ， 它 们 通常 都 是 一 个 记录 的 一 部 分 。 每 个 记录 都 
有 一 个 关键 字 key， 它 是 排序 的 根据 。 记 录 的 其 他 数据 称 为 卫星 数据 ， 即 它们 都 是 以 key 为 
中 心 的。 在 一 个 实际 的 算法 中 ， 当 对 关键 字 重 排 时 ， 卫 星 数 据 也 是 要 一 起 移动 的 。 如 果 每 个 
记录 都 很 大 ， 我 们 可 以 对 一 组 指向 各 个 记录 的 指针 进行 排列 ， 以 求 减少 数据 移动 量 . 

从 某 种 意义 上 来 说 ， 正 是 这 些 实现 细节 才 使 得 一 个 完整 的 程序 不 同 于 算法 .。 不管 我 们 要 
排序 的 是 单个 的 数值 或 是 记录 ， 就 排序 的 方法 来 说 它们 都 是 一 样 的 。 因 而 ， 为 了 集中 考虑 排 
泣 间 题 ， 我 们 一 般 都 假设 输 人 仅 巾 数值 构成 


排序 算法 


在 第 一 章 中 ， 我 们 介绍 了 物种 对 a 个 实数 排序 的 算法 。 搬 人 排序 的 最 坏 情 况 运行 时 间 
为 @(n3)， 但 是 因 该 算法 的 内 循环 是 紧密 的 ， 故 对 小 规模 输 人 来 说 ， 它 是 一 个 快速 的 置换 排 
序 算法 。 (一 个 排 岸 算法 是 冒 搞 的 是 指 在 掩 序 过 程 中 始终 有 固定 数目 的 元 素 存 在 数组 外 .) 合 
并 排序 有 着 较 好 的 渐 近 运行 时 间 @(lg bj， 但 其 中 的 MERGE 过 程 不 能 做 置换 操作 。 

在 本 部 分 中 ， 我 们 要 介绍 另 两 种 对 任意 实数 排序 的 算法 。 第 七 章 中 介绍 堆 排 序 ， 它 可 以 
在 Oo gm) 时 间 内 究 成 排序 。 这 个 算法 中 要 用 到 一 种 重要 的 称 为 堆 的 数据 结构 来 实现 优先 
级 队列 。 

第 八 章 介绍 快速 排序 , 它 的 最 坏 情 况 运行 时 间 为 Bo, 平均 情况 运行 时 间 为 @n lg oj)。 
在 实际 中 ， 它 常常 是 优 于 堆 排序 的 。 像 插入 排序 算法 一样， 快速 排序 的 找 码 也 比较 紧凑 ， 所 
以 它 的 运行 时 间 中 隐 含 的 常数 因子 就 很 小 。 对 于 大 数组 的 排序 来 说 ， 这 是 个 很 常用 的 算法 。 

插 人 排序 、 合 并 排序 、 准 排序 和 快速 排序 都 是 比较 排序 算法 : 通过 对 数组 中 的 元 素 进 行 
比较 来 排序 。 为 研究 比较 算法 的 性 能 极限 ， 第 九 章 - -开始 就 介绍 决策 树 模 型 。 利 用 这 个 类 
型 ， 我 们 可 以 证 明 任 何 比 较 排 序 算法 的 最 坏 情 况 运行 时 间 的 下 界 为 Qtn lgm， 说 明了 堆 排 


rs 92 一 - 


序 和 合并 排序 都 是 浙 近 最 优 的 比较 排序 算法 。 

第 九 章 接 下 去 说 明了 如 果 我 们 能 通过 利用 非 比 较 的 其 他 方法 来 获得 有 关 输 入 数组 中 的 已 
排序 售 息 ， 则 可 以 得 到 比 Don lg nm) 更 准确 的 下 界 。 例 如 ， 计 数 排序 算法 搬 定 输 人 数 取 自 集 
合 {1，2，…， 革 jj。 通 过 利用 数组 下 标 来 决定 元 素 的 相对 次 序 ， 该 算法 可 在 O(k+tn) 时 间 内 
完成 对 个 数 的 排序 ， 这 样 ， 当 k= On) 时 ， 计 数 排序 的 运行 时 间 就 与 输 人 数组 的 规模 成 
线性 关系 。 另 一 个 相关 的 算法 、 即 基数 排序 算法 ， 可 以 用 来 扩大 计数 适用 的 范围 。 如 果 有 nn 
个 整数 要 排序 ， 每 个 整数 都 有 d 位 ， 且 每 位 都 取 自 集合 {1，2，…， 革 ，、 则 基数 排序 可 在 
Old(n+k)) 时 间 内 完成 排序 。 当 d 是 个 常数 、k 是 Da) 上 时， 基数 排序 就 以 线性 时 间 运 行 。 
第 三 种 算法 ， 桶 排 库 ， 要 求 对 各 个 数 在 输入 数组 中 的 概率 分 布 有 所 了 解 ， 它 可 以 对 均匀 分 布 
在 半 开 区 间 [0，1) 上 的 mn 个 实数 以 平均 情况 时 间 On) 进行 排序 。 


顺序 统计 学 


一 个 由 nm 个 数 构成 的 集合 上 的 第 ij 个 顺序 统计 即 该 集合 中 第 i 小 的 数 。 我 们 也 可 通过 对 
输入 进行 排序 并 标 出 输出 的 第 1 个 元 素来 选择 第 ij 个 顺序 统计 。 如 果 对 输入 的 分 布 不 做 任何 
假设 ， 这 个 方法 的 运行 时 间 为 Qtn lgb)。 

在 第 十 章 中 ， 读 者 将 会 看 到 ， 即 使 输 人 数组 中 的 各 元 素 为 任意 实数 ， 我 们 急 能 在 On) 
时 间 内 找到 第 站 小 的 元 素 。 我 们 将 给 出 一 个 算法 ， 其 代码 很 紧凑 ， 最 坏 情 况 运 行 时 间 为 
On ) ， 平 均 情 况 下 为 线性 时 间 ， 另 外， 我 们 还 将 给 出 一 个 更 复杂 的 算法 ， 其 最 坏 情 况 时间 
为 On) 。 
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第 七 章 “ 堆 排序 


本 章 要 介绍 一 种 新 的 排序 算法 ， 即 堆 排 序 。 像 合并 排序 一 样 ， 堆 排序 的 运行 时 间 为 On 
lg n)。 它 又 像 插 人 排序 一 样 ， 是 一 种 原 地 置换 算法 ; 在 任何 时 候 ， 数 组 中 仅 有 固定 数目 的 
元 素 存 在 数组 外 。 这 样 ， 堆 排序 就 结合 了 我 们 讨论 过 的 两 种 排序 算法 的 优点 。 

堆 排 序 还 体现 了 另 一 种 算法 设计 技术 : 利用 某 种 数据 结构 《在 此 算法 中 为 * 堆 *) 来 乍 理 
算法 执行 中 的 信息 。 堆 数据 结构 不 只 是 在 堆 排序 中 有 用 ， 还 可 构成 一 个 有 效 的 优先 队列 。 它 
在 后 面 章节 的 算法 中 还 将 出 现 。 

“ 堆 " 这 个 词 最 初 是 在 堆 排序 中 提出 的 ， 但 后 来 就 逐渐 指 “ 废 料 收 集 存储 区 "， 就 像 程 序 设 
计 语 言 Lisp 中 所 提供 的 设施 。 我 们 这 几 的 堆 却 不 是 废料 收集 存储 区 ; 本 书 中 以 后 任何 地 方 
提 到 堆 结 构 ， 都 是 指 这 儿 提 到 的 结构 。 


7.1 挫 


(二 叉 )》 堆 结 构 是 一 种 数组 对 像 ， 它 可 以 被 视 为 一 棵 完全 二 叉 树 〔 见 5.5.3 节 ) 如 图 7.1 
所 示 。 树 中 每 个 节点 与 数组 中 存放 该 节点 中 值 的 那个 元 素 对 应 。 除 了 最 后 一 屋外 ， 树 的 每 一 
屋 都 是 填 湛 的 。 表 示 一 个 堆 的 数组 具有 两 个 属性 : length[A]， 即 数组 中 的 元 素 个 数 ; 
heap 一 sizefA1， 是 存放 在 A 中 的 堆 的 元 素 个 数 ， 亦 即 ， 虽 然 Af1..length[A]] 都 可 以 含有 有 将 
值 ， 但 A[heap 一 size[A]l 之 后 的 元 索 都 不 属于 相应 的 堆 。 此 处 heap--size[A1slength[Al。 树 的 
根 为 A[il]。 给 定 了 某 个 节点 的 下 标 i， 其 父 节 点 PARENTG) ， 左 儿子 LEFT)， 右 睛 子 
RIGHTG) 的 下 标 可 以 很 简单 地 计算 出 来 : 


PARENTIiD) 

retur | 1 ”21 
LEEFTI) 

retartn 2 
RIGHTG 

retum 32 二] 


在 大 才 数 计算 机 上 ，LEFT 过 程 可 以 在 一 条 措 令 内 计算 出 2i， 方 法 是 将 i 的 二 进 表示 左 
移 1 位。 类 似 地 ，RIGHT 过 程 也 可 通过 将 i 的 二 进 表示 左 移 1 位 并 在 低位 中 移 进 一 个 1 来 
笋 快 好 计算 2i+1。PARENT 过 程 则 可 以 通过 把 i 右 移 1 位 而 得 到 1 iv 2j。 在 堆 排 序 的 一 个 
好 的 实现 中 ， 这 三 个 过 程度 以 “ 宏 " 来 实现 。 
堆 结 构 还 满足 堆 性 质 : 对 除根 以 外 的 每 个 节点 i 
和 [PARENT(D ] 兰 入 ( (7.1) 
即 某 个 节点 的 值 至 多 是 和 其 父 节点 的 值 一 样 大 。 这 样 ， 堆 中 的 最 大 元 素 就 存放 在 根 节点 中 ， 


且 每 一 节点 的 子 树 中 的 节点 值 都 小 于 该 节点 的 值 。 

定义 树 中 一 个 节点 的 高 度 为 从 该 节点 到 树 的 叶 节 点 的 最 长 向 下 的 简单 路 径 上 边 的 数目 ; 
定义 树 的 高 订 为 其 根 的 高 度 。 因 为 具有 荆 个 元 素 的 堆 是 基于 一 棵 完全 二 叉 树 的 ， 则 其 高 度 
为 Qilg Dj (练习 7.1-2) 。 我 们 将 看 到 ， 对 堆 的 一 些 基本 操作 的 作用 时 间 至 多 与 树 的 高 度 成 
正比 ,为 O(igm。 本 章 的 下 面部 分 要 给 出 五 个 基本 过 程 ， 说 明 它 们 在 排 庆 算 法 和 优先 级 队 
列 的 作用 。 

HEAPIFY 过 程 ， 其 运行 时 间 为 (lg 0n)， 是 维持 堆 性 质 《7.1) 的 关键 . 

BUILD-HEAP 过 程 ， 以 线性 时 间 运 行 ， 可 以 从 无 序 的 输 人 数组 中 梅 造 出 一 个 堆 来 ， 

HEAPBSORT 过 程 ， 运 行 时 间 为 Dfn lgn)， 对 一 个 数组 进行 排序 。 

- EXTRACT-MAX 过 程 和 INSERT 过 程 ， 运 行 时 间 为 OU(lgn )， 使 堆 结 构 可 以 作为 一 

个 优先 级 队列 窗 用 。 
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(9) 
图 71 纵 总 二叉树 和 数组 


7.2 名 持 堆 的 性 质 


HEABPIFY 是 对 堆 进行 操 钴 的 重要 子 程序 。 其 输 人 为 一 个 数组 入 和 下 标 ij。 3 
HEAPIFY 被 调用 时 ， 我 们 都 假定 以 LEFTID) 和 RIGHTO) 为 根 的 两 棵 子 树 都 已 是 堆 ， 二- 
这 时 Ai] 可 能 小 于 其 子女 ， 这 样 就 违反 了 堆 性 质 (7.1)。HEARPIFY 让 Ai 处 的 值 下 降 到 堆 
中 的 合适 位置 ， 使 以 i 为 根 的 子 树 成 为 一 个 夫 。 


HEAEIFYIA，D 

l--LEFTO) 

fr RIGHTOD) 

计 1 和 heabp 一 size[A] and 入 由 > 入 [j] 
tthen |atEests 一 | 
elSB 。 ]2TEeSt 志 

让 『SPe3p 一 Size 1] amd 点 [> 页 [arges 妇 
te TYpeqte -下 

让 arpgest zj 
thenm Exehange 各 [= 一 ”入 [lareest] 

HEAPIPYLA，largest) 


名 这 -了 nn 上 一 


[ 


图 72 说 明了 HEAPIFY 的 作用 过 程 。 此 处 heap-size[A]= 10。 (a) 该 维 的 初始 构造 ， 


在 记 点 i=2 处 Al2 违 皮子 堆 性 质 ， 因 为 它 不 大 于 它 的 两 个 子女 。 在 (bj) 中 通过 交换 AD2] 寺 
A[4 在 节点 2 处 恢复 了 堆 性 质 ， 但 又 在 节点 4 处 违反 了 堆 人 性质。 现在 递归 调用 
HEAPIFY(A、4) 就 置 1=4。(c) 中 在 交换 了 A[4] 与 A[9] 后 ， 节 点 4 处 堆 性 质 得 到 恢复 ， 
递归 调用 HEAPIFY(A，9) 对 该 数据 结构 不 再 引起 任何 改变 。 在 算法 的 每 一 步 里 ， 从 元 素 
Ai，AILEETG) ] 和 AIRIGHT(D) ] 中 找 出 最 大 的 ,并 将 其 下 标 存在 largest 中 。 如 昌 A[i] 是 
最 大 的 ， 则 以 让 为 根 的 子 树 已 是 堆 ， 算 法 结束 ， 棒 则 ，i 的 基 个 子 节点 中 有 最 大 元 索 ， 则 交 . 
换 Ali 和 Allargestl， 从 而 使 1 及 其 子女 满足 堆 性 质 。 交 换 后 的 节点 largest 中 有 原先 的 
Ap 中 访 节点 为 根 的 子 树 又 有 可 能 速 反 堆 人 性质 ， 因 而 要 对 该 子 树 递 归 调 用 HEAPIFY， 





图 7 了 .2 HEAPIFY(A，32) 的 操作 过 程 


HEAPIFY 作用 在 一 棵 以 节点 丰 为 根 的 大 小 为 ma 的 子 树 上 的 运行 时 间 为 镶 〈1)?， 在 这 个 
时 间 内 完成 调整 元 素 A[]，A[LEFTGO] 和 A 生 RIGHTO] 的 关系 ， 并 对 以 1 的 某 个 子 节 点 为 根 
的 子 树 递 归 调 用 HEAPIFY。i 的 子 节点 的 子 树 大 小 约 为 2n 7 33， 最 坏 情况 发 生 在 树 的 最 诲 
一 层 恰好 为 半 满 的 时 候 ， 这 时 HEAPIFY 的 运行 时 间 可 由 下 式 描述 ; 
Ttn) 所 T(2ny7 3) + 名 (HU 
根据 定理 4.!1 的 情况 2， 该 递归 式 的 解 为 Th =OfIgo。 或 者 我们 可 以 将 
HEAPIFY 作用 于 一 个 高 度 为 h 的 堆 上 的 时 间 表 示 为 Oh). 


7.3 建 礁 


我 们 可 以 下 底 向 上 地 用 HEAPIFY 来 将 一 个 数组 A[1..n] (此 处 n=length[A]) 变 成 一 
个 堆 。 因 为 子 数 组 A[ (1 nyZ 24 +H) ,中 的 元 素 都 是 树 中 的 叶子 ， 每 个 都 可 看 作 是 只 合 一 


个 元 素 的 堆 。 过 程 BUILDP~HEAP 对 树 中 的 每 一 个 其 他 节点 都 调用 一 次 HEAPIFY。 对 各 
个 节点 处 理 的 次 序 保 证 了 以 基 全 节点 i 的 子 节点 为 根 的 子 柑 都 已 成 为 堆 后 才 处 理 i。 


BUILD 一 HEAP(AJ) 

1 heap 一 Size[AA]- 一 enmgth[A] 

2 forie [length[A]721 downto | 
凶 do HEAPIFYI 和 点， 和 





图 7.3 BUILD-HEAP 的 操作 过 程 


图 7.3 给 出 了 BUILD~HEAP 作用 过 程 的 一 个 例子 , 去 出 了 在 BUILD--HEAP 的 第 3 
行 调 用 HEAPIFY 之 前 的 数据 结构 。 (a)j 一 个 包含 10 个 元 素 的 输入 数组 A 及 其 所 表示 的 二 
又 树 。 图 中 示 出 了 在 调用 HEAPIFY(A，i 之 前 循环 下 标 i 指向 节点 5。 (b) 结果 所 得 的 数 


据 结 构 。 循环 下 标 在 下 一 轮 执行 中 指向 节点 4。 (ec) - (e) BUILDP-HEAP 中 for 循环 的 后 
续 执行 过 程 。 注 意 当 对 某 节 点 调用 HEAPHFY 时 ， 该 节点 的 商 棵 了 树 都 已 是 堆 . (站 
BUILD-HEAP 执行 完毕 后 的 堆 . 

我 们 可 以 这 样 来 计算 BUILD_HEAP 的 一 个 简单 上 界 : 每 调用 -次 HEAPIEY 的 时 间 
为 DOIlgnm， 共 有 DO (n) 次 调用 ， 故 运行 时 间 至 霓 为 Da 翅 n)。 这 个 界 凡 管 是 对 的 ， 但 从 
痢 近 意义 上 讲 还 不 够 紧 确 。 

实际 上 我 们 可 以 得 到 一 个 更 紧 确 的 界 ， 因 为 对 树 中 具有 不 同 高度 的 节点 HEAPIFY 作 
用 的 时 间 不 同 ， 并 且 大 部 分 节点 的 高 度 都 较 小 。 关 于 更 紧 确 的 界 的 分 析 依赖 于 这 样 -- 个 性 
质 ， 即 在 含 nm 个 元 索 的 堆 中 至 多 有 ay 2 1 个 节点 的 高 度 为 h 《网 练 避 7.3-3)， 

HEAPILFY 作用 在 高 度 为 h 的 节点 上 的 时 间 为 Qth)， 我 们 可 将 BUIULD~-HEAP 的 总 伐 


价 表 达 为 
| ] Ti [1 1g. h 
之 AT Itb) 一 ol 之 滞 【7.2) 
右边 的 和 式 可 以 通过 用 x =172 代 人 公式 (3.6) 求 得 : 
yh - 172 _ 


2 (173 

这 样 ，BUILD 一 HEAP 运 行 时 间 的 界 为 
| 1 总 

ol 生 )=of na 了 入)- oo 


这 说 明 我 们 可 在 线性 时 间 内 将 一 个 无 序数 组 建成 -. 个 堆 ， 
7.4 堆 排 序 算法 


堆 排 序 算法 开始 时 先 用 BUILD-HEAP 将 输入 数组 Afl..n] (此 处 n=lengthfAj). 构造 
成 一 个 堆 ， 因 为 数组 中 的 最 大 元 素 是 在 根 :A[IHj 上 ， 则 可 通过 把 它 与 A[m 立 换 来 达到 最 终 的 
正确 位 置 上 。 现 在 ， 如 果 我 们 从 堆 中 “去 掉 ? 节 点 D (通过 减 小 heap-size[A])， 可 以 很 容易 
地 将 A[1..0 建 成 一 个 堆 。 原 来 根 的 子女 都 是 堆 ， 但 新 的 根 元 素 却 可 能 违背 内 性 质 (7.1)。 这 
时 调用 HEAPIFY(A，1) 就 可 以 保持 这 个 性 质 ， 结 果 的 堆 在 A[1.，(n-1) ] 中 。 堆 排序 算法 
继续 这 个 过 程 ， 直 至 堆 的 大 小 由 mn-1 到 2 将 止 。 


HEAPSORT(A) 

1 BUILDR-HEARIA) 

2 for iengtb[A] downto 2 

3 qdo Exchange 和 [1 一 > 生日] 

和] heap 一 size [入 ]< 一 heab 一 size[A] 一 1 
< HEAPIFYIA，1) 


图 7.4 给 出 了 在 官 始 堆 建 立 后 堆 排 序 的 一 个 例子 。 图 中 的 每 个 堆 者 与 算法 第 2 行 的 for 
循环 的 每 一 次 过 代 对 应 。 (a) 在 用 BUILDP-HEAP 构造 堆 后 所 得 的 堆 数 据 结构 。 (by -- 
0) 每 次 在 第 5 行 后 中 调用 HEAPIFY 之 后 的 堆 ， 同 时 述 示 出 了 当时 的 值 。 仅 是 那些 阴影 节 


点 留 在 维 中 。 企 ) 结果 的 排序 数组 A。 
HEAPSORT 过 程 的 时 间 代 价 为 Da lg nn)， 其 中 调用 BUILD-HEAP 的 时 间 为 Oom， 
nm 次 HEAPIFY 调用 中 的 每 一 次 的 时 间 代 价 为 〈1g Ia。 
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图 了 .4 HEAPSORT 的 操作 过 程 


7.5 优先 级 队列 


虽然 堆 排序 算法 是 一 全 很 漂亮 的 算法 ， 但 在 实际 中 ， 快 速 排序 的 一 个 好 的 实现 往往 优 于 
垃 排 序 。 尽 管 这 样 ， 扒 数据 结构 还 是 有 着 很 大 的 用 处 。 在 这 一 节 中 ， 我 们 要 介绍 堆 的 一 个 很 
常见 的 应 用 : 作为 高 效 的 优先 级 队列 。 

优先 弘 队 列 是 一 种 用 来 维护 由 一 组 元 素 构 成 的 集合 S 的 数据 结构 ， 这 一 组 元 素 中 的 每 
一 个 部 有 个 关键 字 key。 作 用 于 优先 级 趴 列 上 的 操作 有 以 下 一 些 : 

INSERT(S，zx): 把 元 素 x 插入 集合 S。 这 一 操作 可 宕 为 Se-SLjfix}。 
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MAXIMUMI(S)}: "返回 S 中 具有 最 大 关键 字 的 元 素 。 

EXTRACT-MAXI(S): 去 掉 并 返回 8S8 中 具有 最 大 关键 字 的 元 素 . 

优先 级 队列 的 一 个 庶 用 是 在 一 台 分 时 计算 机 上 进行 作业 调 床 。 这 种 队列 对 要 执行 的 各 作 
业 及 它们 之 间 的 相对 优 移 级 加 以 记录 。 当 一 个 作业 做 完 或 被 中 断 时 ， 用 EXTRACT-MAX 
操作 从 等 行 的 作业 中 选择 出 具有 最 高 优先 级 的 作业 。 在 任何 时 候 一 个 新 作业 可 以 用 1N- 
SERTE 加 人 到 队 列 中 去 . 

优先 级 队列 还 可 用 于 事件 驱动 的 仿真 器 。 在 这 种 应 用 中 ， 队 列 中 的 各 项 是 要 仿真 的 事 
件 ， 每 一 个 都 有 一 个 发 生 时 间作 为 其 关键 字 。 事 件 仿真 要 按照 各 事件 发 生 时 间 的 顺序 进行 ， 
因为 仿真 某 一 囊 件 证 能 导致 稍 后 对 其 他 事件 的 仿真 。 对 这 个 应 用 ， 可 以 逆转 优先 队列 的 线性 
人 次序， 并 可 用 MINIMUM 和 EXTRACT-MIN 操作 取代 MAXIMUM 和 
EXTRACT-MAXK 操作 。 这 时 ， 仿 真 程 序 在 每 -- 步 都 用 EXTRACT-MIN 来 选择 下 一 个 楼 
仿真 的 事件 。 当 新 事件 产生 时 ， 就 用 INSERT 将 其 搬 人 优先 级 队列 。 

用 推 结构 来 实现 优先 队列 是 很 自然 的 。 只 杰 返 回 堆 中 A[] 的 值 ，HEAP--MAXIMUM 
操作 就 可 在 @(H 时 间 内 返回 堆 的 最 大 元 素 ，HEAP-EXTRACT-MAX 过 程 则 与 堆 排序 过 
程 的 for 循环 体 〈 第 3-5 行 ) 类 羽 : 


HE 和 PP 一 也 其 TRR 和 CT 一 MAAX(A) 

1 让 jheap 一 size[ 和 ] < 1 

2 then errorheabp Underflow” 
了 maxs- 上 [1] 

4 各 [1]<-- 和 六 [heabp 一 Size[ 和 A 

5 heap 一 size[ 上 J<-heap 一 size[A] 一 ] 

在于 芋 APIFYIA，1) 
Y Tetoutm Imax 


HEAPIEY 一 EXTRACTI-MAX 的 运行 时 间 为 Q(18 m， 因 为 它 除 了 时 间伐 价 为 O( ] 
n) 的 HEAPIFY 外 ， 兵 做 很 少 的 固定 量 的 工作 。 

下 面 的 HEAP-INSERT 过 程 则 是 将 一 个 节点 播 人 到 堆 A 中 。 首 先 ， 它 将 堆 加 以 扩 
展 ， 即 在 树 的 最 后 一 层 加 一 片 叶子 。 然 后， 就 像 1.1 节 中 INSERT-SORT 中 揪 人 循环 (第 
5$-7 行 ) 一 样 ， 这 个 过 程 遍历 由 新 加 到 根 的 路 径 ， 以 找到 放 新 元 素 的 合适 位 置 : 

HEAP-TNSE 录 TIA，key) 
heap 一 size[ 太 ]=-bheap 一 size[ 太 ]+] 
js-heap 一 Si2e[ 各 ] 
whbilje i>l and 起 [ 疡 ARENTU) ] < Key 
do AD-A[PARENTIi) ] 

ix- 了 ARENTIOD) 

各 站 <-key 


hi 一 


团 7.5 示 出 了 HEAP-INSERT 操作 过 程 的 一 -个 例子 , (a) 在 插 人 一 个 关键 字 为 15 的 节 
所 之 六 图 7.4(a) 中 的 堆 。(b) 向 树 中 如 人 了 一 个 新 的 时 节点 。(c) 从 新 的 时 节点 鞋 根 的 路 
从 上 的 值 被 向 下 复制 ， 坦 至 找到 适合 关键 字 15 的 位 置 。(d) 插 人 关键 字 15。 该 过 程 作用 在 
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一 个 会 mn 个 元 素 的 堆 上 的 时 间 为 DUg nj 因为 从 新 加 的 时 节点 诗 根 的 路 径 长 讶 为 OUg 加 。 
总 之 , 堆 结构 支持 任 一 种 作用 于 大 小 为 n 的 集合 的 优先 级 队列 操作 , 时 间 代 价 为 Deg 品 。 





7-1L 由 搬入 而 建 堆 


第 7.3 节 中 的 BUILD~-HEAP 过 程 也 可 通过 反复 用 HEAP-INSERT 将 各 元 素 插 人 堆 
中 来 实现 . 。 
考虑 如 下 的 实现 : 
BUILD-HEARP(A) 
1 heap--size[Aj= 1 
2 forf 3 to ength[A] 
3 do HEAP-INSERT(A， 人 入 间 ) 
a. 当 输入 数 给 相 闻 时， 和 过程 BUILD-HEAP 与 BUILD-HEAE 产 生 的 堆 是 耕 总 是 一 
样 ? 车 读者 认为 是 的 ， 请 证 明 ;， 介 则 ， 请 给 上书 一 个 反例 ， 
.证 明 : 最 二 情况 下 ，BUILD-HEAR' 用 Gin ign) 时 闻 来 建成 一 个 含 个 匹 素 的 
堆 ， 
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7-2 对 d 允 堆 的 分 析 ， 


d 又 堆 有 点 像 二 叉 崔 ， 但 其 中 的 每 个 节点 可 有 d 个 子女 ， 而 不 只 是 二 个 。 
”8a. 如 何在 一 数组 中 表示 一 个 d 叉 堆 ? 
b. 含 个 元 素 的 乍 又 堆 的 以 nm 和 表示 的 高 度 是 多少 ? 
c. 给 出 EXTRACTIT-MAX 的 一 个 有 效 的 实现 ， 并 分 析 其 运行 时 间 。 
d. 给 出 TNSE 有 T 的 一 个 有 效 的 实现 ， 并 分 析 其 送行 时 间 。 
e. 给 出 HEAP-INCREASE-KPEYIA，i，k) 前 一 个 实现 ， 该 过 程 执行 Al<- 
maxtA 利 ，k)， 并 相应 地 更 新 堆 结 构 。 请 分 析 其 运行 时 间 。 
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7.1--1 在 高 床 为 hn 的 堆 中 ， 最 大 和 最 小 的 元 素 个 数 基 多少 ? 

.3T.4-2 证 明 : 会 个 元 素 的 堆 高 度 为 [ 地 nj 。 

?7.1-3 证 明 : 在 一 个 堆 的 某 - 一 标 子 灯 中 的 最 大 元 素 在 该 子 树 的 根 上 . 
7.1-4 堆 的 最 小 元 驼 可 能 在 在 于 堆 的 到 些 地 方 ? 

7.1-5 一 个 呈 道 序 的 数组 是 一 个 堆 吗 ? 

7.1- 和 6 序列 <29，17，14，6，13，10，1，5，7 了 ，12> 是 个 堆 吗 ? 


7.2-!1 利明 尔 7.2 作为 一 个 范例 ， 图 示 出 HEAPIFY(A，3) 作用 于 数组 和 = <27，17，3，16，13， 
10，1，5，7，12。4，8，9，0> 的 过 程 。 

7.2-2 当 元 素 A 半 大 和 王 它 的 两 个 子 节点 时 ， 调 用 HEAPIFY(A，D 的 绪 果 怎样 ? 

7.2-3 对 i>heap-size[A] 72， 调用 HEAPIFY(A，i) 的 效果 怎样 9 

7.2-4 HEAPIFEY 的 代码 效率 较 高 ， 但 第 10 行 申 的 递归 调 朋 可 能 例外 ， 它 可 能 使 某 些 编译 程序 产生 
出 低 辫 的 代码 。 请 用 一 个 措 环 控制 结构 【loop)j 取代 递 晤 ， 从 而 写 一 个 更 为 有 将 的 了 EAPIFY。 

7.2-5 诞 明 : 对 一 个 大 小 为 m 的 堆 ，HEAPIFY 的 最 坏 情 况 运 行 时 间 为 M 人 D)。 


7.3-1 模仿 图 7.3， 示 出 BUILD-HEATP 作用 于 教 组 入 = <5， 3，17，10，834， 19， 扣 ， 23，8> 的 过 
程 ， 

7.3-2 在 BUILD-HEAP 竺 法 的 代码 中 ， 我 们 为 什么 希望 第 2 行 中 循环 下 标 1 从 1 lengtn[A]ly21 降 
到 1， 而 不 是 由 和 蔡 到 | lengtb[ 和 上] /249 

73-3 证 明 :， 在 任 一 售 n 个 元 素 的 堆 中 , 此 多 有 ny 2h+1 1 个 商 订 为 n 的 节点 。 


7.4-1 模仿 图 7.4， 说 明 REAPSORT 在 数组 A= 一 5， 13， 2，25，7，17，20，8，、4，> 上 的 作用 过 
程 。 ， 
7.4-2 对 一 个 其 所 有 站 个 元 素 已 按 鸳 增 序 排列 的 数组 A， 堆 排序 的 运行 时 间 是 多 少 ? 车 A 的 元 素 旺 
递 降 序 昵 ? 

7.4-3 证 明 : 堆 排 序 的 运行 时 间 为 Pnlgn)。 


7.5-]1 模仿 图 7.5， 给 出 HEAP-INSERT(A，3 作用 子 堆 A<15，、13，9，5，12，8，7，4，0， 
6，2，1> 的 过 程 ， 

7.5-2 说 明 HEAP-EXTRACT-MAX 作用 于 堆 和 <15，13，9，5，12，8，7，4，0， 人 6 2，1> 的 
过 程 。 
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7.$-3 说 明 如 柯 用 优先 级 队列 来 实现 一 个 先进 先 出 队列 . 筋 请 说 明 如 们 用 代 先 级 队列 来 实现 术 
(FIFO 队列 和 栈 的 定义 见 11.1 节 .) 

7.3-4 请 给 出 过 程 HEAP-INCREASE-KEY(A，ij，k) 的 一 个 QUlgnm 时 间 的 实现 . 这 个 过 程 执行 
[]< max(A[i，#)， 并 相应 地 更 新 堆 结 构 。 

7.5-5 HEAP-DELETE(A， 认 措 作 将 节点 丰 中 的 项 从 堆 和 中 其 去 . 对 舍 个 元 素 的 堆 ， 请 给 出 时 间 
为 OK 起 的 HEAP-DELETE 的 实现 。 

7.5-6 请 给 出 一 个 时 间 为 On lgk&) 的 、 用 来 将 上 个 已 振 序 表 合并 成 一 个 排序 才 的 算计 此 处 刁 为 所 
有 输入 才 中 元 素 的 总 雪 。 { 提 示 : 用 堆 来 做 工 路 合并 ) 
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第 八 章 “快速 排序 


快速 排序 是 一 种 在 售 n 个 数 的 输入 数组 上 最 坏 情况 运行 时 间 为 @(n ) 的 算法 。 虽 然 这 
个 最 坏 情 况 运行 时 间 较 差 ， 快 速 排序 却 是 用 于 排序 的 最 佳 的 实用 选择 ， 因 为 其 平均 性 能 相当 
好 : 期 望 的 运行 时 间 为 8@nlgn， 且 @algm 记号 中 隆 含 的 常数 因子 很 小 ， 另 外 ， 它 述 
能 够 进行 原 地 去 换 排 序 ， 在 虚 存 环境 中 也 能 很 好 地 工作 .、 * 

8.1 节 介 绍 快速 排序 算法 及 它 用 来 划分 数组 的 一 个 重要 程序 .这 个 算法 的 运行 情况 比较 
复杂 ， 在 8.2 节 我 们 先 给 出 对 其 性 能 的 直观 讨论 ， 稍 后 再 给 出 精确 分 析 。8.3 节 将 介绍 快速 
排序 的 两 种 使 用 随机 数 产生 器 的 版 本 。 这 两 个 “随机 化 的 "算法 有 着 许多 很 好 的 人 性质。 它们 的 
平均 情况 运行 时 间 较 好 ， 也 没有 什么 特殊 的 输入 会 导致 最 坏 情 况 行为 。 这 两 个 版 本 的 一 个 将 
在 8.4 节 分 析 ， 其 最 坏 情 况 运行 时 间 为 Otn)， 平 均 情 况 时 间 为 Dlnlg mn)- 


8.1 对 快速 排序 的 描述 


像 合并 排序 一 样 ， 快 速 排序 是 基于 1.3.1 节 介 绍 的 分 治 模式 上 的 。 下 面 是 对 一 个 典型 子 
数组 Ap. 忆 排序 的 分 治 过 程 的 三 个 步骤: 

分 解 : 数组 A[p.] 被 划分 成 两 个 非 空子 数组 A[p..q] 和 A[q+1..9， 使 得 Ap.. 了 ] 的 每 个 元 
素 都 小 于 等 于 Afq+1. 如 中 的 元 素 。 下 标 q 也 在 这 个 划分 过 程 中 进行 计算 。 

解决 : 通过 递归 调用 快速 排序 对 子 数组 A[p..q] 和 A[q+1..9 排 序 。 

合并 ; 因为 两 个 子 数 组 是 原 地 排序 的 ， 不 需要 将 它们 合并 : 整个 数组 A[p.2q] 已 排序 . 

下 面 的 过 程 实 现 了 快速 排序 : 


QUICKSORTIA，p，T) 

1 让 pP<r 

2 ”then ge-PARTIIION(A，p，fF 
3 QUICKSORT(A，p，g) 

4 QUICKSORT(A，d+1， 日 


. 为 排序 一 个 完整 的 数组 A， 最 初 的 调用 是 QUICKSORT(A，1，length[A]) 。 
对 数组 进行 划分 
快速 排序 算法 的 关键 是 PARTITION 过 程 ， 它 对 子 数 组 Afp..r] 进 行 划分 : 


PARTITION(A，bpb， 吕 


1 xn -AIp] 
2 it 一 ] 
3 人 | 
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4 while 了 TRUE 

5 do reheat 六- 放 1 
看 ”atil 羡 付 过 

了 TBeat 这- 计 1 

名 untii 和 国 关 x 

人 证 1 研 忆 ] 

折 thet exchanmg AD]- -AD 
11 glSE Teturn j 


图 8.1 说 明了 PARTITION 的 扫 行 过 程 。 阴 影 较 浅 的 数组 元 素 已 被 置 于 正确 的 划分 
中 ， 阴 影 较量 的 元 素 还 没有 处 于 其 划分 之 中 。(a)j 输入 数组 ，i 和 j 的 初始 值 丛 处 于 数组 的 
两 端 之 外 。 我 们 围绕 x=A[pl= 5 进行 划分 。(b) while 循环 的 第 一 次 执行 中 i 和 j 在 第 9 行 
”处 的 位 置 。 (ec) 在 第 10 行 中 交换 由 i 和 j 指向 的 元 素 的 络 采 。 (d) 在 while 循环 的 第 二 次 执 
行 中 第 9 行 处 i 和 j 的 位 置 。(e) while 循环 的 第 三 次 《也 是 最 后 一 次 ) 技 行 中 第 9 行 处 1 和 
j 的 位 置 。 因 为 izj， 该 过 程 结束 ， 并 返回 值 q=j。 直 到 A[j] 的 数组 元 素 《包括 AD) 都 小 
于 或 等 于 x=5， 而 Afj] 之 后 的 元 素 都 大 于 或 等 于 x=5。 首 先 ， 它 从 Afp. 如 中 选 出 元 素 
x=Afp] 作 为 支点 "元 素来 划分 A[p. 如 ， 从 而 产生 出 Afp..l 和 Af. 菩 前 者 的 每 个 元 素 小 于 
等 于 x， 后 者 的 每 个 元 素 大 于 等 于 x。 开 始 时 ，i=p-1，j=r+l， 故 两 个 子 数组 是 空 的 。 
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图 8.1 PARTITION 作用 于 一 个 样本 数组 的 过 程 
过 

在 while 循环 体 中 ， 下 标 j 有 源 减少 ，i 逐 靳 增加 ， 直 到 A 国 兰 xX 芝 AD]。 假 设 这 两 个 不 等 
式 是 严格 的 ， 则 A[] 对 于 克 边 的 子 数 组 来 说 太 大 ， 币 ADj] 对 右边 的 子 数 组 太 小 。 通过 第 10 
行 中 交换 A 四 和 A[] ， 可 以 扩展 两 个 子 数组 。 

wtile 循环 的 体重 复 至 jzj 结束 ， 这 时 原 数 组 Ap. 可 已 被 分 成 两 个 子 数 组 上 APp..qj 和 
A[q+1..0， 其 中 p 和 q<r， 前 一 个 子 数组 的 元 素 都 不 大 于 后 一 个 中 的 元 到 。 该 过 程 结 束 时 返 
回 值 q=j。 

从 概念 上 说 ， 划分 过 程 执行 了 一 个 简单 的 函数 : 它 把 小 于 的 元 素 放 在 原 数 组 的 底部 区 
域 ， 而 把 大 于 x 的 元 素 放 在 顶部 区 域 。 但 PARTITION 过 程 中 用 了 一 些 技巧 。 例 如 ， 下 标 i 
和 j 绝对 不 会 超出 A[p. 熙 的 界 ， 但 从 代码 中 不 容易 看 出 这 点 。 另 外 ， 很 重要 的 一 点 是 用 Aip] 
来 作为 支点 元 素 X。 如 果 用 了 人 四 有 而 A 四 又 恰好 是 A[p. 了 中 的 元 素 ， 则 PARTITION 返回 
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给 QUICKSORT 的 值 为 q=tr， 这 就 会 使 QUICKSORT 无 限 循环 下 去 问题 8-! 将 要 求 读 

者 对 PARTITION 的 正确 性 加 以 证 明 ， 
PARTITION 作用 在 数组 A[p.rlj 上 的 运行 时 间 为 四 (n) ， 此 处 0 一 tpP+1【《 殉 练习 

8.1--3) 。 


8.2 忆 速 排 太 的 性 能 


。 快速 排序 的 运行 时 间 与 划分 是 否 对 称 有 关 , 而 后 考 又 与 选择 了 哪 一 个 元 素 作 划 分 有 关 . 
如 果 划 分 是 对 称 的 ,本 算法 从 渐 近 意义 上 讲 就 和 合并 算法 一 样 快 ， 如 果 划 分 不 对 称 , 则 本 算法 
渐 近 上 就 和 插 人 算法 一 样 慢 。 本 节 里 我 们 讨论 当 划 分 为 对 称 或 非 对 称 时 快速 排序 的 性 能 ， 


最 坏 情 况 划分 


快速 排序 的 最 坏 情 况 行为 发 生 在 划分 过 程 产 生 的 两 个 区 域 分 别 包 含 .n-1 个 元 素 和 1 个 
元 素 的 时 候 (证 明 见 8.4.1 节 )。 假 设 算法 的 每 一 步 都 出 现 这 种 不 对 称 划分 。 因 为 划分 的 时 
间 代 价 为 Bt， 又 TU =@()， 故 算法 的 运行 时 间 可 递归 表达 为 
To) =To-lD -Hom 
为 求 这 个 递归 式 的 解 注意 到 TUD) 一 60D)， 对 上 起 进 行 迁 代 ， 有 : 
TIn) 一 TI 一 1) 十 四 人 n)} 


一 > WUo 


攻 一 1 


一 四 (2 
一 局 人“ 


上 面 最 后 一 行 是 由 于 " k 是 个 算术 级 数 (3.2) 得 出 来 的 。 图 8.2 给 出 了 快速 排序 最 坏 情 况 
执行 过 程 的 递归 树 〈 见 4.2 节 有 关 递 归 树 的 讨论 ) 





et ) 
图 8.2 快速 排 岸 最 坏 情 况 下 执行 过 程 的 递 扫 树 | 
如 果 在 算法 的 每 一 递归 步 枝 处 划分 都 是 最 不 对 称 的 ， 则 其 和 运行 时 间 为 @o5 ， 这 个 最 坏 
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情况 运行 时 间 与 插 人 排序 的 是 一 样 的 。 另 外 ， 当 输 入 数组 已 排 好 序 时 ， 快速 排序 的 时 间 代 价 
也 为 昌 (a 裤 ， 而 这 对 插 人 排序 来 说 只 要 On) 时 间 。 


最 佳 居 况 划分 


如 果 划 分 过 程 产 生 的 两 个 区 域 太 小 都 为 n/ 2， 则 快速 排序 运行 得 就 快 和 多 了 。 这 时 有 
TG) =2T(a7y2) +etn) 
根据 定理 4.1 的 情况 2， 其 解 为 Ta) =@ 了 pm。 轿 8.3 给 出 了 快速 排序 最 佳 情况 下 
执行 过 程 的 递归 树 。 


an 人 由 各 
听 疝 明 涡 人 近 SS 人 全 一 1 





月 
6 玉 八 
图 8.3 ”快速 排序 最 佳 情 况 下 执行 过 程 的 递归 树 
鱼 下 eTianei nnre omimirmmeee rinieeet 。 3 月 
aa 1- | je 开 
iogi04 一 一 -一 ”一 
2 办 8 hv 
) 186” 而 7 1007” 订 ? 
8gi0r9 1 AAA AA\ 7 AN NA AN 
7 8] 。 729 ”。-: 加 
] -一 于 玫 
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图 84 9 此 1 划分 时 的 一 棵 递归 树 
对 称 划分 
快速 排序 的 平均 情况 运行 时 间 与 其 最 佳 情况 运行 时 间 很 接近 ， 这 一 点 我 们 可 以 从 8.4 节 
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的 分 析 中 看 到 。 要 理解 这 一 点 就 要 理解 划分 的 对 称 性 是 如 何在 撒 述 运行 时 间 的 递 妇 式 中 反映 
例如 、 假 设 划 分 过 程 总 是 产生 9 : 1 的 划分 。 乍 一 看 这 种 划分 很 不 对 称 。 这 时 有 递归 式 
Ta) =T9nyv 10) HT 10) +Ta 

为 方便 起 见 ， 上 式 中 我 们 用 代替 了 @(m。 图 8.4 示 出 了 对 应 这 个 递归 式 的 递归 树 。 
请 注意 该 树 的 每 一 层 都 有 代价 n， 直 到 在 深度 logiom = @@(1gn) 处 达到 边界 条 件 ， 以 后 
各 层 的 代价 至 多 为 na。 递归 于 深度 logiovon=@(Ig nm) 处 结束 。 这 样 ， 快 速 排序 总 的 时 间 代 
价 为 Btn lg mn) ,从 渐 近 上 看 就 和 划分 是 在 正中 间 进 行 的 效果 一 样 。 事 实 上 ， 即 使 是 99 : 1 
的 划分 的 时 间 代价 也 是 Dtn lg n) 。 其 原因 在 于 ， 任 何 一 种 按 常数 比例 进行 的 划分 都 产生 深 
度 为 'B(lgm] 的 递归 树 ， 其 中 每 一 层 的 代价 为 Q(n)， 因 而 不 论 该 常数 比例 具体 是 什么 ， 总 
的 运行 时 间 都 是 B(n lg on)。 


关于 平均 情况 的 直觉 考虑 


要 想 对 快速 排序 的 平均 情况 有 个 较为 清楚 的 和 概念 ， 我 们 就 要 对 遇 到 的 各 种 输入 作 个 假 
设 。 通 常 都 假设 输 人 数据 的 所 有 排列 都 是 等 可 能 的 。 下 一 节 中 我 们 要 讨论 这 个 假设 ， 现 在 先 
来 看 看 它 的 一 些 变形 。 

当 我 们 对 一 个 随机 的 输入 数组 闻 用 快速 排序 时 ， 要 想 在 每 一 居 上 都 有 同样 的 划分 是 不 太 
可 能 的 。 我 们 所 能 期 刻 的 是 某 些 划分 较 对 称 ， 另 一 些 则 很 不 对 称 。 例 如 ， 练 习 8.2 一 5 就 要 求 ， 
读者 说 明了 ARTITION 所 产生 的 划分 80% 以 上 都 比 9 : 工 更 对 称 ， 而 另 20% 则 比 9 :1 差 .， 

平均 情况 下 ，PARTITION 产生 的 划分 中 厂 有 “好 的 ”， 又 有 “ 差 的 "。 这 时 ， 与 PAR- 
TITION 执行 过 程 对 应 的 递归 树 中 ， 好 、 差 划分 是 随机 地 分 布 在 树 的 各 层 上 的 。 为 与 我 们 的 
直觉 相 一 臻 ， 假 设 好 、 差 划分 交替 出 现在 树 的 各 层 上 ， 且 好 的 划分 是 最 佳 情 况 划分 ， 而 差 的 
划分 是 最 坏 情况 下 的 划分 ， 图 8.5(a) 中 示 出 了 递归 树 的 连续 两 层 上 的 划分 情况 。 在 根 节点 
处 ， 划 分 的 代价 为 mn， 划分 出 来 的 两 个 子 数 组 的 大 小 为 n-1 和 1， 即 最 坏 情 况 。 在 根 的 下 一 
层 ， 大 小 为 mn-1 的 子 数 组 按 最 佳 情 况 划分 成 大 小 各 为 (n-1) /2 的 两 个 子 数组 。 这儿 我 们 
假设 含 1 个 元 索 的 子 数组 的 边界 条 件 代价 为 1。 


弄 。 : . 
一 人 re ed 杖 eunj 
| . . 机 


. fir+l le 
(一 AZ (1 
(aa) 全 ) 


疼 8.5 快速 排序 的 递归 树 中 划分 的 两 种 情况 


在 一 个 差 的 划分 后 接 一 个 好 的 划分 后 ， 产 生出 三 个 子 数组 ， 大 小 各 为 1，(n-b /2 各 
(n-1 2， 代 价 共 为 2n-1=@tn)。 这 与 图 8.5(b) 中 的 情况 差不多 。 该 图 中 一 层 划分 就 产 
生出 大 小 为 【n-1)》 72+1 和 (nl 72 的 两 个 子 数 组 ， 代 价 为 n= 驴 (中 。 这 种 划分 差 不 “ 
多 是 完全 对 称 的 ， 比 9; !1 的 划分 要 好 。 从 直觉 上 看 ， 差 的 划分 的 代价 @(n)j 可 稚 吸 收 到 好 
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的 划分 的 代价 @() 中 去 ， 结 果 是 一 个 好 的 划分 。 这 样 ， 当 好 、 差 划分 交替 分 布 划分 都 是 好 
的 一 样 : 仍 是 Da lg m， 但 O- 记 号 中 隐 售 的 常数 因子 要 略 大 一 些 。 关 于 平均 情况 的 严格 分 
析 将 在 8.4.2 中 给 出 . 


8.3 快速 排序 的 随机 化 版 本 


在 探讨 快速 排序 的 平均 性 态 过 程 中 ， 我 们 已 假定 输入 数据 的 所 有 排列 都 是 等 可 能 的 。 如 
果 输 入 的 分 布 广 足 这 个 假设 时 ， 许 多 人 认为 快速 排序 是 对 足够 大 的 输入 的 理想 选择 ， 但 在 工 
程 中 ， 这 个 假设 就 不 会 总 是 成 立 〈 见 练习 8.2-3]) 。 这 一 节 介绍 随机 化 算法 的 概念 ， 并 给 出 
快速 排序 的 两 个 随机 化 版 本 ， 它 们 能 够 克服 分 布 的 等 可 能 性 假设 所 带 来 的 问题 . 

与 对 输 人 的 分 布 作 “ 假 设 " 不 同 的 是 对 输入 的 分 布 作 " 规 定 "。 例 如 ， 假 设 在 排序 输 和 人 数组 
前 ， 快 速 排序 对 其 元 素 加 以 随机 排列 ， 以 强制 的 方法 使 每 种 排列 满足 等 可 能 性。 (练习 
8.3--4 要 求 给 出 一 个 能 在 O(n) 时 间 内 对 含 n 个 元 素 的 数组 加 以 随机 排列 的 算法 . ) 这 种 修 
改 不 改变 算法 的 最 坏 情 况 运行 时 间 ， 但 它 却 使 得 运行 时 间 能 够 独立 于 输 人 数据 已 排序 的 情 
况 。 

称 一 个 算法 是 随机 化 的 ， 如 果 其 行为 不 仅 取 决 于 输入 ， 而 且 还 取决 于 随机 数 产 生 器 所 产 
生 的 数据 。 我 们 将 假设 有 一 个 随机 数 产 生 器 RANDOM 供 我 们 利用 。 每 调用 一 次 RANT- 
DOM(a，b) 就 返回 一 个 介 于 a 和 之 间 的 整数 《包括 a 和 hb)， 且 产生 每 个 整数 的 可 能 性 
都 是 相同 的 。 例 如 ，RANDOM(0，1) 产生 0 或 1 的 概率 都 为 1/ 2。 每 次 调用 RANDOM 
所 返回 的 整数 值 与 前 几 次 调用 是 独立 的 。 你 可 以 把 RANDOM 想像 成 滚动 一 枚 〈b-a+1) 
面 的 骨 子 以 获得 其 结果 。 (实际 中 ， 多 数 程序 设计 环境 提供 的 都 是 伪 随 机 数 产生 器 : 一 个 确 
定性 的 算法 返回 看 上 去 是 统计 随机 的 数 ,) 

快速 排序 的 这 个 随机 化 版 本 有 一 个 和 其 他 随机 化 算法 一 样 的 有 趣 性 质 : 没有 一 个 特别 的 
输入 会 导致 最 坏 情 况 性 态 。 这 种 算法 的 最 坏 情况 狂 态 是 由 随机 数 产生 器 决定 的 。 你 即使 有 意 
给 出 一 个 坏 的 输入 也 没 用 ， 因 为 随机 化 排列 会 使 得 输入 数据 的 次 序 对 算法 不 产生 影响 。 只 有 
在 随机 数 产 生 器 给 出 了 一 个 很 不 巧 的 排列 时 ， 随 机 化 算法 的 最 坏 情 况 性 态 才 会 出 现 。 练 习 
13.4-4 说 明了 几乎 所 有 的 排列 都 可 使 快速 排序 接近 平均 情况 性 态 : 只 有 非常 少 的 几 个 排列 
才 会 导致 算法 的 近 最 坏 情 况 性 态 。 

一 般 来 说 ， 当 一 个 算法 可 按 多 条 路 未 做 下 去 ， 但 又 很 难 决定 哪 一 条 保证 是 好 的 选择 时 ， 
随机 化 策略 是 很 有 用 的 。 如 果 大 部 分 选择 都 是 好 的 ， 则 随机 地 选 一 个 就 行 了 。 通常， 一 个 算 
法 在 其 执行 过 程 中 要 做 很 多 选择 。 如 果 一 个 好 的 选择 的 获 益 大 手 坏 的 选择 的 代价 ， 那 么 随机 
地 做 一 个 选择 就 能 得 到 一 个 很 有 效 的 算法 。 我 们 在 8.2 节 已 经 了 解 到 ，。 对 快速 排序 来 说 ， 一 
组 好 坏 相 杂 的 划分 仍 能 产生 很 好 的 运行 时 间 。 因 此 我 们 可 以 认为 该 算法 的 随机 化 版 本 也 能 具 
有 较 好 的 性 态 。 

通过 修改 PARTITION 过 程 ， 可 以 设计 出 快速 排序 的 使 用 随机 选择 策略 的 版 本 。 在 快 
速 排 序 算法 的 每 一 步 中 ， 当 数组 还 没有 被 划分 时 ， 可 将 元 素 A[p] 与 A[p..q 中 随机 选 出 的 一 
个 元 素 交 换 。 这 个 修改 保证 了 支点 元 素 x=A[p] 取 子 数组 中 rp+1 个 元 索 中 的 任何 一 个 的 可 
能 性 相同 。 这 样 ， 我 们 就 能 期 望 对 输 和 人 数组 的 划分 一 般 都 是 较 对称 的 。 那 种 基于 对 输入 数组 
如 以 钴 机 排列 的 随机 化 算法 的 平均 性 态 也 很 好 ， 只 是 比 这 目 介 绍 的 这 个 版 本 更 难以 分 析 。 
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日 


PARTITION 和 QUICKSORT 被 修改 的 部 分 比较 少 。 在 新 的 划分 过 程 中 ， 交 换 是 在 划 
分 之 前 做 的 : 


RANDOMIZED-PARTITION(A， pP，D) 
1 i -RANDOMp， 口 

2 exchange 内 [Pj<--=~ 页 [ 

3 retbutm PARTITION(A，P，rT) 


新 的 快速 排序 通过 调用 RANDOMIZED_-PARTITION 来 做 划分 


RANDOMIZED-QUICKSORT(A，p，D 


t 下 上 <T 

了 then 9g<-RANDOMIZED 一 PARTITIONI(A，P，、r) . 
3 RANDOMIZED-CQUICKSORT(A，b，9) 

如 有 ANDOMIZED 一 CUICKSORTI(A，g+1，m) 


在 下 一 节 中 我 们 将 对 这 个 算法 进行 分 析 。 
8.4 快速 排序 分 析 


8.2 节 从 直觉 上 对 快速 排序 的 最 坏 情 况 性 态 、 它 为 何 运行 得 较 快 等 作 了 一 些 讨论 。 本 节 
中 ， 我 们 给 出 对 快速 排序 性 能 的 严格 分 析 。 先 进行 最 坏 情 况 分 析 ， 这 对 QUICKSORT 和 
RANDOMIZED-QUICKSORT 都 一 样 ， 然 后 分 析 RANDOMIZED -QUICKSORT 的 平 
均 情 况 性 能 . 


8.4.1 最 坏 情况 分 析 


在 8.2 节 中 我 们 看 到 ， 如 果 快 速 排序 中 每 一 层 递 归 上 所 做 的 都 是 最 坏 情 况 划分 ， 则 运行 
时 间 为 8 )。 从 直觉 上 看 ， 这 就 是 最 坏 情 况 运 行 时 间 。 下 面 来 证 明 .。 
利用 替换 方法 〈 见 414 节 )， 可 以 证 明快 速 排序 的 运行 时 间 为 @@(n3] 。 设 Tn) 是 过 程 
QUICKSORT 作用 于 规模 为 n 的 输入 上 的 最 坏 情 训 时 间 ， 则 有 : 
To) = imax (T(Q) +To 之 q) ) +Gn) (8.1) 


[ 宕 本 本 mn 一 1 


其 中 参数 q 由 1 变 到 n-1， 这 是 因为 过 程 PARTITION 产生 两 个 区 域 ， 每 个 的 大 小 至 
少 为 1， 我 们 猜测 TEn) 所 co 成 立 ，c 为 常数 。 将 此 式 代 人 (8.1 ， 得 : 
TIn) 所 max (cq +cm 一 q) ”) 十 妇 (n) 


上 看 届 扩 和 一 人 


一 CC Imax (q 十 人 一 q) ) 十 四 


【村 吉 妈 n 一 1 


表达 式 9+ (n-q) 2 在 区 间 1<qsn-1 的 某 个 喘 点 上 取得 最 大 值 ， 因 为 该 式 关于 q 的 
二 阶 导数 是 正 的 。( 见 练习 8.4-2) 这 样 就 有 界 maxi<o<niq 寺 《ngqg) 六 和 1+ (TD) 
:= 一 2(0 一 1) 。 
对 工 (In) 台 有 : 
--110 一 


To) < em 一 2ca-D +Gm 
所 ci ， ， 
因为 我 们 可 以 选择 足 侣 大 的 ce， 使 项 2c(n-1)y 能 支配 虽 (n) ， 这 样 ， 快 囊 排 序 猎 法 的 
(最 坏 情 况 ) 运行 时 间 为 BC )。 


8.4.2 科 均 情况 分 析 


我 们 已 经 从 直觉 上 说 明了 为 什么 RANDOMIZED-QUICKSORT 的 平均 情 襄 和 运行 时 间 
为 四 nlgm: 如 果 有 RANDOMIZED-PARTITION 所 做 出 的 划分 使 任意 固定 量 的 无 索 仿 向 
划分 的 某 一 边 ， 册 算法 的 递归 树 深 度 为 @lig nm， 旦 在 @(Llgn) 层 上 所 做 的 工作 量 为 
gtn)。 要 精确 地 分 析 RANDOMIZED-~QUICKSORT 的 运行 时 间 ， 就 要 首先 理解 划分 过 
程 是 如 何 进行 的 。 然 后 ， 林 以 对 排序 含 nm 个 元 素 的 数组 所 需 的 平均 时 间 建 立 一 个 递归 式 。 
通过 解 该 递归 式 就 可 确定 期 望 的 算法 运行 时 间 的 界 。 作 为 解 访 递归 式 过 程 的 一 部 分 ， 我 们 还 
将 给 出 一 个 有 趣 的 级 数 的 界 ， 


关于 划分 过 程 的 分 析 


我 们 先 来 看 看 PARTITION 的 执行 过 程 。 当 过 程 RANDOMIZEPD-PARTITION 的 第 
3 行 中 调用 PARTITION 时 ， 元 素 Aip] 筷 与 Afp. 品 中 的 一 个 随机 元 素 进行 了 交换 。 为 简化 
分 析 ， 假 设 所 有 输 人 数据 都 是 不 同 的 。 即 使 不 是 所 有 的 输 人 数 都 不 相同 .快速 排序 的 半 均 情 
况 运 行 时 间 仍 为 On ljg nan)， 但 这 时 的 分 析 就 要 复杂 一 些 。 

由 PARTITION 返回 的 值 q 仅 依 赖 于 x=Afp] 在 A[P..9 中 的 秩 (rank)。( 某 个 数 在 一 个 
集合 中 的 秩 是 指 该 集合 中 小 于 或 等 于 该 数 的 元 素数 .) 如 果 设 a= 吐 p+1 为 Afp..q 中 的 元 索 
数 ， 将 A[pj 与 Atp, 了 中 的 一 个 随机 元 素 交 换 就 得 rank(x) =i fi=1，2，…， nm) 的 概率 为 
1 mn。 

下 一 步 来 计算 划分 过 程 不 同 结果 的 可 能 性 。 如 果 rank(x) =1， 则 PARTITION 的 第 
4-11 行 while 循环 的 第 一 次 执行 中 ， 下 标 i 停 在 i=Pp 处 ， 下 标 j 倍 在 j=pP 处 。 当 返回 g=】 
时 ， 划 分 结果 的 * 低 区 "中 就 含有 唯一 的 元 素 A[p]。 这 个 事件 发 生 的 慨 率 为 17n， 因 为 
rank(x) =1 的 概率 为 17n。 

如 果 rank(xz) 兰 2， 则 至 少 有 一 个 元 素 小 于 AIpl]， 帮 在 while 循环 的 第 一 次 执行 中 ， 下 
标 i 停 于 i=p 处 ， 下 标 j 则 在 达到 之 前 就 停 住 了 。 这 时 通过 交换 就 可 将 A[p] 墅 于 划分 结果 
的 高 区 中 。 当 PARTITION 结束 时 ， 低 区 的 rank(x) -L[ 个 元 素 中 的 每 一 个 邦 产 格 小 于 x。 
这 样 ， 对 每 个 ij= 1，2，…，m1， 当 rank(x) 宕 2 时， 划分 的 低 区 中 含 丰 个 元 素 的 概率 为 
1 7 了。 

把 这 两 种 情况 综合 起 来 ， 我 们 的 结论 为 : 划分 的 低 区 的 大 小 q-~p+1 为 1 的 概率 为 
27n， 为 1 的 概率 为 17n，i=2，3，…，n 一 1。 


关于 羊 均 情 况 性 态 的 一 个 递归 式 


更 在 让 我 们 来 对 RANDOMIZED-QUICKSORT 的 期 望 运行 时 间 建 立 一 个 递归 式 。 设 
To) 表 示 排 序 售 mn 个 元 素 的 数组 所 知 的 平均 时 间 。 当 输入 数 组 只 会 1 个 元 素 时 ， 调 用 


一 1 一 


RANDOMIZED-QUICKSORT 的 时 间 为 常数 ， 即 TU)=B(D)。 当 输入 数组 为 AI1..n] 时 ， 
调用 RANDOMIZED-COUICKSORT 划分 数组 的 时 间 为 @@ 人 tm。 划分 过 程 返回 再 标 q, 而 ， 
后 对 长 度 为 gs 和 n-9q 的 两 个 子 数组 递归 调用 RANDOMIZED QUICKSORT. 这 样 ， 排 
序 一 个 长 度 为 n 的 吉 组 的 平均 时 间 可 表达 成 


T(m==( TD+TGO 一 D 十 Zaw+ro- :em (8.2) 
q 人 的 分 布 基本 上 基 均 的 ， 但 值 9 = ! 的 可 能 性 是 其 他 值 的 两 倍 . 根据 前 面 所 作 的 最 坏 情 
况 分 析 有 : T() =@() ， 1 一 DOm ) ， 所 以 : 

=(T() +To 一 1 ) =-= (e() +oe2) ) = oo 
这 可 被 《8.2) 式 中 的 项 @tn) 所 吸收 《8.2) 式 可 被 重 述 为 : 

Ta) = 1 (TGq) +Te-q ) + ea) ， (8.3) : 


汪 间 对 上 1 2 …， mm 一 1， 和 式 中 每 一 顺 To 为 Ttqj 和 TIn 一 和 中 的 机 会 各 有 一 
次 。 把 这 两 项 迭起 来 就 有 : 


To) = 2 了 TI +em 。 (8.4) 


和 =1 


解 递 归 式 


我 们 用 替换 方法 来 解 递 归 式 8. 4) 归纳 假设 Tn) 近 an lg n+b，a>0 和 hb>f0 为 待定 
的 常数 ， 可 以 名 汪 是 斑 开 的 a 和 hb 使 anign+b 大 于 T(1)， 对 n>1， 有 : 


TIn) 一 二 2 TUky 十 加 二) 


<2 了 (akligk +b) 上 +@) 


径 开 ngk+ 凶 a_D +eow) 
最 后 一 和 中 的 和 式 可 如 下 限 闪 : 


1 1 >: 志 
Z kigk 和 忒 5 en 一 8" 。 【8.5)》 
由 这 个 界 可 得 : 


2 (1 " 2hb 
和 芝 和 芝 一 二 二 一 
工人) Ja2legn 1n 十 忆 (na 一 1 十 加 tn 
妆 anlgn 一 an 十 2b 十 母 上 n) 
-anlgn+b+ (eda) +b 一 an 


么 anlgn 十 b 


一 112 一 


因为 我 们 可 以 选择 足够 大 的 a 使 za 能 够 决定 @(n) 十 b。 所 以 ， 快 速 排序 的 平均 运行 时 间 
为 OOlgn) 。 
上 述 和 式 的 妈 确 界 


现 证 明了 Xigk 的 界 (8.5)。 因 为 和 式 中 每 一 项 至 多 是 mlg n， 则 有 界 : 


这 是 个 比较 紧 确 的 界 ， 但 对 解 递归 式 Ton) =- Onlgn)》 来 说 还 不 够 强 。 为 解 该 递归 式 ， 我 
们 希望 有 界 >n?lgn -Qtn?) 。 
为 得 到 这 个 界 ， 可 将 和 式 分 解 为 两 部 分 ， 就 如 在 3.2 节 讨论 过 的 那样 ， 这 时 有 : 


Ta 和 一 | 卫 一 【 


Zaek= > ugk+ 三 kgk 


上 上 亚 上 下 二 kk 一 [er21 


等 号 右边 第 一 个 和 式 中 的 jgk 可 由 lgtn 7 2) 一 本 一 1 从 上 方 限界 、 第 二 个 和 式 中 的 1gk 可 
让 lga 从 上 上方 限界 ， 这 样 ， 
ask (mm-D > k+myrk 


下 1 E=1 fnxa1 
一 1 fmrs1 一 上 


一 lgn>k 一 》 k 
茎 na 一 8 
2 

对 n > 2 成 立 。 这 就 是 界 (8.5) 。 


8-Lt 划分 的 正确 性 


请 论证 8.1i 节 中 的 过 程 PARTITION 是 正确 的 ， 并 证 吉 下 列 命题 : 

a. 下 标 1 和 j 不 会 指 右 数组 A 中 区 间 [p.. 吕 以 外 的 元 素 。 

b, 当 PARTITION 结束 时 ， 下 标 j 不 等 于 r。 

c. 当 PARTITION 结束 时 ，A[p.j 中 的 每 个 元 素 都 小 于 等 于 A[j+l.. 吕 中 的 每 个 元 素 ， 


8-2 工 ortuto 划分 算法 


考虑 由 N.Lormmuto 对 PARTITION 所 作 的 变形 。 为 划分 A[p.r， 这 个 版 本 产生 出 两 个 
区 域 : 入 虽 , 宙 和 上 fit+l， 使 得 第 一 个 区 域 中 的 元 素 小 于 等 于 x=Am， 第 二 个 区 域 中 的 元 素 


一 上 ti3- 一 


都 大 于 x。 


LOMLUTO-PARTITIGONI(A，P， 菇 


1 XI 

2 1<P 一 | 

JJ fer ja-p to T 

下 do 讨 生 订 委 x 

5 then ii] 

看 excChangeAjij< 一 ~AD] 
了 于 1<r 

器 tbhen Tetutrnm 1i 

多 else return ji 一 | 


a. 论 证 LOMUTO--PARTITION 是 正确 的 。 

hb. 在 PARTITION 和 LOMUTO-PARTITION 中 ， 一 个 元 素 可 被 移动 的 最 大 次 数 各 是 
多 少 ? 

c- 论 评 在 -- 个 含 员 个 元 素 的 子 数 组 上 ，LOMUTO-PARTITION 的 运行 时 间 为 日 (n) 。 

d. 当 所 存 输入 交 均 相 局 时 ， 用 LOMUTO-QUICKSORT 来 取代 PARTITION 会 如 何 
影响 QUICKSORT 的 运行 时 间 ? 

e. 定 义 一 个 过 程 RANDOMIZED-LOMUTO-PARTITION， 使 之 先 把 A[ 晤 与 从 
A[p.9 中 随机 选 出 的 一 个 元 素 效 换 后 调用 LOMUTO-PARTITION、。 证明: 由 
RANDOMIZED-LOMUTO~-PARTITION 返回 一 给 定 值 q 的 概率 等 于 
RANDOMIZED-PARTITION 返回 pH+r-a 的 概率 。 


8-3 Stooge 排序 


Howard，Fine 等 教授 握 出 了 下 面 的 “漂亮 的 "排序 算法 : 


STOOGE-SORTIA，i， 塘 


] 让 A 四 > 站 

2 then exchange 二 [ 让 < -一生 加 

3 记 计 ]>j 

才 thenm Tetur 可 

5 Ke-| (it 7 3 ”六 下 售 人 

6 STOGOGE-SORT(A，i， 广 k) 心 关上 的 三 分 之 一 

7 STOOGE-SORTA，ik, 门 从 后 面 的 三 分 之 二 

8 STOCOGE-SORT(A，i， 广 ) 人 因 又 是 头 上 的 三 分 之 二 


a. 论 证 STOOGE-SORT(A，1，length[Ah 能 够 正确 排序 数组 A[1..0，n=length[A]， 

b. 绽 出 一 个 措 述 STOOGE-SORT 最 坏 情 况 运 行 时 间 的 递归 式 ， 并 给 出 最 坏 情 况 运 行 时 
间 的 一 个 紧 确 的 渐 近 界 〈 用 @- 记 号 ). 

.比较 STOOGE~SORT 与 插 人 排序 、 合 并 排序 、 堆 排序 和 快速 排序 的 最 坏 情况 运行 时 
间 。 


一 4 和 一 


8-4 快速 排序 中 的 堆栈 深 庶 


8.1 节 中 的 QUICKSORT 算法 包含 有 两 个 对 其 自身 的 递归 调用 ， 在 调用 PARTITION 
后 ， 左 边 的 子 数 组 和 右边 的 子 数组 分 别 被 递归 排序 .. QUICKSORT 中 的 第 二 次 递归 调用 并 
不 是 必须 的 ; 可 用 迭代 控制 结构 来 代替 它 。 这 种 技术 称 作 尾 递归 ， 大 多 数 的 编译 程序 都 加 以 
了 采用 。 考 虑 下 面 这 个 快速 排序 的 版 本 ， 它 模拟 了 尾 递归 : 


QUICRKSORT'(A，p，D) 

1 亚 hile 上 < 

2 do 会 划 分 并 排序 左 子 数组 
q<-PARTITION(A，p，D) 
QUICKSORTIA，p，9g) 
p* qd+1l 


Un 


a. 论 证 QUICKSORT'(A，1，length[A]) 能 正确 排序 数组 A。 

编译 程序 在 做 递归 过 程 时 ， 常 常 要 用 堆栈 来 存放 有 关 信 息 ， 如 每 一 次 递归 调用 的 参数 
等 。 有 关 最 近 一 次 调用 的 信息 在 栈 的 顶部 、 而 有 关 第 一 次 调用 的 信息 则 在 栈 的 底部 。 当 一 个 
过 程 被 调用 时 ， 其 信息 被 压 人 栈 ; 当 它 结束 时 ， 其 信息 则 被 弹出 。 因 为 我 们 假设 数组 参数 是 
用 指针 来 表示 的 ， 则 每 个 过 程 的 信息 在 栈 中 只 需要 O(1) 的 栈 空间 。 堆 乒 深 度 是 在 一 次 计算 
中 用 到 的 堆栈 空间 的 最 大 值 。 

b. 请 给 出 一 种 在 含 n 个 元 素 的 输入 数组 上 QUICKSORT' 的 栈 深 度 为 BCn) 的 情况 . 

.修改 QUICKSORT 的 代码 ， 使 其 最 坏 情况 栈 深度 为 @@(]g nm) 。 


8-S “三 数 取 中 "划分 


有 一 种 改进 RANDOMIZED-QUICKSORT 的 方法 就 是 根据 从 子 数 组 中 更 仔细 选择 的 
(而 不 是 随机 选择 的 ) 元 素 x 来 划分 。 常 用 的 做 法 是 “三 数 取 中 "*: 从 子 数组 中 随机 选 三 个 元 
素 ， 取 其 中 间 数 为 x。 对 我 们 这 个 问题 ,假设 数组 A[1..o 中 元 素 都 不 相同 ， 且 nm 兰 3。 用 
A'[1.n0] 表示 已 排 好 序 的 数组 。 用 “三 数 取 中 "方法 来 选择 支点 元 素 z 并 定义 
hi 一 Prix= 和 人 }。 

.对 .i=2，3，…，n-1， 给 出 pi 的 忆 m 和 ii 表示 的 准确 表达 式 。 

b, 与 一 般 实现 比较 ， 这 种 实现 中 取 x=Af[ [ (ntl)214 ] 的 可 能 性 增加 了 多 少 ? 盆 设 
一 cc， 请 给 这 两 个 概率 比值 的 极限 。 

c. 如 果 定 义 一 个 “好 "的 划分 是 选择 了 x=A' 便 ， 其 中 my73s<si 和 2ny3， 则 与 一 般 实 现 相 
比 ， 这 时 得 到 一 个 好 的 划分 的 可 能 性 增加 了 多 少 ? 《提示 : 用 积分 来 近 做 和 式 .) 

d. 论 证 对 快速 排序 而 言 ,三 数 取 中 "方法 仅 影响 其 运行 时 间 Da lg nj) 中 的 常数 因子 。 


练 习 八 


8.1~1 仿照 图 83.1， 示 出 PARTITION 作用 于 A= <13，19，9，5，12，8，7，4，11，2，6，21> 
上 的 过 程 ， 


一 二 3 一 


8.1- 2 当 数 组 Afp. 吕 中 元 素 均 相同 时 ，PARTITION 返回 的 g 值 是 计 么 ? 
8.1-3 论证 PARTITION 在 大 小 为 站 的 子 数 组 上 的 运行 时 间 为 谷口) 。 
8.1 一 4 如何 锋 下 QUICKSORT 才能 使 其 结果 数组 为 非 增 序 ? 


8.2-1 证 明 : 当 数 组 A 的 所 有 元 素 都 相同 时 ，QUICKSORT 的 运行 时 间 为 @@ 名 尼 D)。 

8.2-2 证 明 : 当 和 的 元 素 排 成 非 增 序 时 ，QUICKSORT 的 运行 时 间 为 Bta3J。 ， 

8.2-3 假设 快速 排 床 每 一 明 上 划分 的 比例 都 是 【1 一 5: &， 其 中 0<as 和 172 是 个 常数 .证明 : 递归 机 
让 时 子 的 量 小 深 眶 欧 为 一 1gnmay7 ta， 最 大 深度 的 为 -lgna 1gCIa) 

8.2-4 * “论证 对 任意 常数 0<asl172 和 随机 的 输 人 数组 ，PARTITION 产生 比 【1-a): a 更 对 称 的 
划分 的 概率 约 为 1 一 28。 


8.3-1 对 一 个 随机 化 算法 ， 为 什么 我 们 只 分 析 其 半 均 情况 人 性 能 ， 而 不 分 析 其 最 坏 情况 狂 能 ? 

8.3-2 在 RANDOMIZED--QUICKSORT 的 执行 中 ， 随 机 数 产后 器 RANDOM 在 前 林 博 况 下 要 被 
调用 驳 少 次 ? 得 最 佳 情况 下 交 皮 样 ? 

8.3-4 * 给 出 一 个 时 间 代 价 为 Btny、 以 数组 AL， 了 为 输入 的 隧 机 化 过 程 ， 使 之 能 对 数组 元 素 进行 隧 
机 排列 。 


8.4-1 ”证明 : 快速 排序 的 最 佳 情况 运行 时 间 为 Qtn lgnm) 。 

8.4-2 证 明 ; 对 qg=1，2，…，n-1，q Ho-dq)“ 在 q=1 或 q=o-1l 处 取 最 大 值 。 

8.4-3 证 明 : .RANDOMIZED-QUICKSORT 的 期 望 运行 时 间 为 如 (落英 。 

8.4-4 对 播 人 排序 来 说 ， 当 其 输 人 已 “于 乎 " 排 好 序 时 ， 运 行 时 间 是 很 小 的 。 在 实践 中 可 以 充分 利用 这 
点 来 改善 快速 排序 的 运行 时 间 。 当 在 一 个 长 度 小 于 的 子 数组 上 调用 快速 排序 时 ， 让 它 不 做 任何 排序 就 返 
加。 当 顶 娠 的 快速 排序 调用 返回 后 ， 对 整个 数组 用 攻 和 排序 来 完成 排序 过 程 。 论 证 这 个 排序 算法 的 运行 时 
问 为 ,Onk+n lgCn kxk))。 在 理论 上 和 实践 中 . 上 应 当 如 何 选 ? 

8.4 一 5 *# 还 明 等 式 : ， 


] 
Xinxdx 一 站 “jnx 玫 


然后 用 积分 近 伏 法 来 给 出 一 个 关于 了 旭 gk 的 比 (8.5) 更 紧 确 的 界 . 


8.4-6 * 考虑 对 PARTITION 过 程 作 这 样 的 修改 : 从 数组 A 中 随机 选择 三 个 元 素 ， 并 按 其 中 数 基 
分 求 出 以 a 的 国 装 形式 表示 的 ， 最 坏 情 况 中 a: (11-a) 的 划分 的 近似 概率 ， 
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第 九 章 ”线性 相间 排序 


到 听 前 为 此 ， 我 们 扎 终 介绍 了 由 种 能 在 Qta nl 和 疆 同 后 天 序 旺 个 数 的 竺 法。 合并 排 择 
租 则 菲 谋 在 最 二 乔 放 下 达到 是 上 办 ， 快 速 排 岩 站 下 二 书本 达到 这 晤 。 重 进一步 ， 对 这 些 算 法 
是 天王 一 个 ， 我 们 都 能 入 纠 一 个 长 度 为 呈 月 往 和 大 线 序列 ， 合 算法 名 下井 运行 

这 些 氏 法 都 有 个 令 人 感 兴趣 的 性 后 : 排 冯 组 果 生 和 站 下 素 的 雇主 征 寺 输入 元 素 问 的 比较 。 
慰 这 类 排序 算法 为 尼 较 排序 ， 到 自前 为 止 合 绍 的 午 有 有 夺 瑚 等 泛 帮 是 外公 排 寺 算法， 

在 9.1 节 患 ， 我 们 将 证明 对 依 站 个 正 素 的 一 个 输入 序列 ， 轩 何 汪 胃 近 二 在 最 还 情况 王者 
要 用 on lgn) 次 比较 米 进 行 排序 。， 由 些 可知， 合并 算法 初 玲 排序 是 渐 近 最 优 的 。 

9.2 和 节 ，9.3 节 和 种 加 4 节 计 论 了 二 种 以 线性 村 司 运行 的 算法 : 计数 排序 ， 基 数 排 序 和 三 排 
幸 。 这 些 算 法 都 用 了 非 华 较 的 一 些 操作 类 生 定 示 束 的 次 序 ， 此 上 上 界 Qtnign) 对 管 们 是 不 适 
册 的 。 


9.1 排序 算法 的 下 界 


在 一 个 比较 排序 算 沪 中 ， 仅 用 比较 米 确定 输入 序列 <aj，ia，…，an> 的 元 素 间 次 序 。 
壕 给 定 两 个 元 素 aa 和 基 ， 测 试 轴 <a， 上 出 系 ， 和 省 二 机 ， 全 区 由 或 告 > 寺 市 的 包 一 种 成 立 ， 以 确 
冠 可 和 ai 间 的 相对 次 译 。 用 任何 别 的 方法 都 无 法 得 到 次 序 信 息 。 

这 一 节 中 ， 不 失 -- 般 人 性， 我 们 假设 所 有 输入 元 索 玫 是 不 同 的 ， 药 定子 这 个 彼 设 ， 央 
au 一 a 形式 的 比较 就 万 用 了 了， 政 又 可 假设 不 向 这 叶 形 式 的 比较 。 又 比较 生 志 十， 机 郑 而 ， 下 > 二 
和 ai<ai 攻 是 等 价 的 、 因 为 由 它们 得 到 的 关 于 各 和 相对 次 序 的 信息 洛 二 相同 的 。 这 样 ， 
区 可 进 - - 步 假 设 所 有 的 比较 部 撒 如 和 所 ai。 


决策 树 模型 


比较 排序 证 被 抽 像 地 视 为 决策 树 。- 一 棵 谈 策 树 表 示 了 了 某 排 序 算 法 作出 于 给 定 输入 上 上 所 概 
的 疡 有 上 比较， 而 控制 结构 ， 数 据 移 妆 等 则 都 玻 忽 略 了 。 图 乡 ! 中 是 对 应 -下 1.1 节 中 揪 和 人 排序 
算法 作 有 于 含 三 个 元 束 的 输入 序列 上 的 决策 树 。 对 输入 元 素 共 有 有 31 =6 种 可 能 的 排列， 故 
该 判定 树 必 会 有 至 少 交 8 个 中 节点。 

在 决策 树 中 ， 每 个 内 节点 都 注 以 aa， 关中 开 ES js 和 n，a 赴 输 人 序列 中 的 无 素 个 
数 。， 每 个 时 节点 都 省 以 排 殉 <rf)，m2)，……，Ftn > ( 砚 61 节 有 关 排 到 的 内 容 。) 排序 
算法 的 执行 对 放 于 史记 一 条 从 树 到 时 节点 的 路 本 、 在 每 个 内 节点 处 此 做 出 较 机 和 志 a。 该 内 节 
点 的 亦 子 概 决定 着 ai 系 ai 以 后 的 比较 ， 面 其 碳 手 树 则 次 宗 着 ai > ai 以 后 的 比较 。 当 到 达 一 个 
时 节点 时 ， 排 序 算法 就 已 确定 了 次 序 ah 系 ao 所 …… 委 am 要 使 排 庆 算 法 能 让 确 工作 ，p 个 
元 素 的 nt 种 排列 中 的 每 一 种 都 旧作 为 雇 策 树 的 一 个 叶子 调 出 更。 
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洗 9 与 作 骨 于 全 个 殉 束 之 上 的 搬 入 排 夯 对 谋 的 划 放 树 


最 坏 情 况 下 界 


在 决策 笨 中 ， 由 根 到 任 一 吐 节点 间 最 控 路 径 的 长度 表示 了 对 诺 的 排序 算法 中 最 坏 情况 比 
较 次 数 。 这 祥 ，- 一 个 比较 排序 猎 法 中 的 上 最 坏 情 况 比 较 次 数 就 与 其 决策 树 的 高 度 对 应 ， 同 时 关 
于 关 决 策 禁 商 度 的 下 界 也 就 十 关 于 比较 排序 算法 运行 时 间 的 下 界 。 下 面 的 定理 给 出 了 这 样 的 
一 个 下 界 。 
定理 9%1 任意-- 棵 对 mm 个 无 素 排 这 的 磊 策 树 有 向 庆 Qtn 志 各。 
证 明 : 苦 虑 对 个 声 索 排序 的 、 高 度 为 b 的 决策 树 ， 因 为 nm 个 元 素 共 有 中 种 排列 ， 每 
一 种 排列 代表 一 种 不 同 的 最 终 排 序 ， 改 该 树 必 须 荣 少 有 mi 片 叶子 。 又 一 棵 高 为 h 的 二 六 友 
的 叶子 数 不 多 于 站 、 划 : 
ni 执 2 
调 允 了 李 对 数 ， 有 : 
h> lgtnl ) 
这 此 因 为 寺 末 数 是 单调 递增 的 。 根 据 Stirting 近似 公式 (2.11)， 有 有 : 
nl >fnv el 
兵员 =271828… 赴 旺 然 对 数 的 在 。 这 样 
hlg(n ee) 
一 下] 才 有 mh ] 丰 e 
一 人 an]Emn) 
推论 92 。 绑 排 让 和 合并 排序 是 渐 近 最 优 的 比较 算法 。 
证 明 : 堆 排 序 和 合并 排序 的 运行 上 时间 上 界 Ofmlgn) 与 定 旭 9.1 给 出 的 最 坏 情 郊 下 界 
Qttnh len) -一 合 。 芝 


9.2 计数 排序 


计数 排序 假设 个 输入 元素 由 的 入 一 个 都 起 分 于 1 到 k 之 问 的 整数 ， 此 处 上 是 整数 . 
sK=Oln) 时 ， 汗 整 排 夯 的 运行 时 间 为 Cn) 。 
计数 排序 的 基本 思想 就 是 对 每 一 个 输 和 人 泡 素 x， 确 定 出 小 于 x 的 元 素数 。 有 了 这 个 信息 
就 可 把 x 站 接 放 到 它 在 最 终 输 出 数组 中 的 位 置 上 。 例 如， 如 果 有 17 个 元 素 小 于 x， 则 x 就 
居 二 第 18 个 和 町 册 位置。 当 有 上 纱 个 元 素 相同 时 ， 这 个 方案 要 略 做 修改 ， 因 为 不 能 把 它 科 族 在 
回 - .个 输出 人 贰 上 。 
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在 计数 排序 算法 的 代码 中 ， 我 们 假定 输入 是 个 数组 A[l.oj，iength[A]=mn。 必 个 还 击 材 
两 个 数组 : 存放 排序 结果 的 BEH .nm]， 担 供 剧 负 存 储 区 的 C[L.W。 


COUNTING 一 SGORTIA， 瑟 ， 芭 ) 
1 for js- ] to 信 

2 do 导 [in 

3 for j*-t to jenglh[Aj 

4 do CA CAb+i 

3 cfi] 现 在 包含 党 十 的 二 索 个 数 

6 for i=2 to 下 

7 do C[il<- [让 HC[i 一 1 

8 人 CI] 现在 包含 小 二 或 等 十 的 元 素 个 数 
9 for 入 length 各] dowrtto 1 

t0 do BC[ATi= :各 [证 

11 C[A[ijj CA5 一 ] 


图 9.2 示 出 了 计数 排 岸 。 其 中 A 的 每 -个 沁 索 都 症 不 大 于 杰 = 和 的 止 刺 数 。(a) 在 第 4 
行 后 的 数组 A 和 辅助 数组 C。 (bl 在 第 7 了 7 行 之 后 的 数组 C。(e) -人 (el 分 别 为 第 和 11 行 中 
循环 的 三 次 执行 之 后 的 数组 了 B 和 辅 二 数 组 各。 数 纪 了 中 仅 是 线 阳 影 部 分 元 素 被 十 人 。 (TD 
最 终 的 排序 输出 数组 B。 在 算法 中 第 1-2 行 的 初始 化 后 ， 在 第 3-4 行 中 检查 每 个 输 人 元 
素 ， 如 果 某 一 输入 元 素 的 值 是 i， 则 增加 CC 四 。 人 在 第 3 4 行 后 ，C 国 中 放 着 等 于 守 的 输入 无 素 
数 ，i= 1，2，…，k。 存 第 6-7 生 中 ， 对 每 全 i=1，2，…，k， 确 定 有 才 少 输入 元 素 小 于 
或 等 于 i。 

最 后 ,在 第 8 -11 行 中 ,把 每 个 元 索 A 国 避 在 输出 数组 B 中 与 其 相 谋 的 最 终 位 置 上 。 如 果 
所 有 了 个 元 素 都 不 相同 ， 则 当 第 一 次 做 到 第 9 行 时 ， 对 每 个 Ail， 值 CIA[ 回 旺 为 A[ 在 输出 
数组 中 的 最 终 正确 位 置 ， 因 为 共有 CLAb] 个 匹 素 小 二 等 于 入 征 。 


] 23 4 5 下 


4131644111314|114| 1 2 








3 4 5 6 
23 4 5 5 cl212|4|?7|1718| 
cEroE2reD 
{ 动 fb) {c) 
1 2 3 45 6 了 8 1 羡 3 4 5 0 7 8 
对 1 十 交 :4 | 4 下 到 12345678 
1 23 45 5 1.2 3 4 5 6 8 [111 3|4|41416 
cz21sfs[7Ts clifa[4[s[?1s] 
(d) ke) ( 件 


图 92 CQOUNTING-SORT 作用 汪 - -个 输入 数组 Af1.. 中 工 的 过 程 


当 输 大 元 索 中 有 相同 值 时 ， 每 将 一 个 A 轩 放 人 人 B 数组 时 就 喊 少 C[Afij; 这 就 使 得 下 一 
个 其 值 等 于 A[ 的 输入 元 素 【如 果 存 在 的 话 ) 直接 进 人 输出 数组 中 Ab] 的 前 一 个 位 置 。 
计数 排序 的 峡 间 代价 是 冤 少 ” 第 1--2 行 的 far 循环 所 花 时 间 为 O(k)， 第 3 一 4 行 中 foer 
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御 坏 所 花 时 间 为 Dim， 第 6-7 行 的 for 循环 所 花 时 间 为 D(k)， 第 9-I1 行 的 for 循环 所 花 
时 间 为 tn)。 这 样 ， 总 的 时 间 就 是 DO(k+tn) 。 在 实 臣 中 ， 当 Kk= On 时， 我 们 常常 采用 计 
数 排序 ， 这 时 其 这 行 时 间 为 On)。 

计数 排序 的 下 界 优 于 我 们 在 9.1 节 证 明 的 Qtp 过 四， 因为 它 术 是 个 比较 排序 和 法， 事实 
上 ， 基 代码 中 根本 就 不 出 现 输入 元 素 之 间 的 比较 。 相 反 ， 计 数 排序 是 用 了 输入 元 素 的 实际 值 
米 确 定 它 们 在 数组 中 的 位 置 。 当 我 们 所 用 不 是 比较 排序 模型 时 ，@tn jg n) 就 不 适用 了 ， 

计数 排序 的 一 个 重要 性 策 就 是 它 是 稳定 的 : .具有 相同 值 的 元 素 在 输出 数组 中 的 相对 次 序 
3 莪 们 在 输入 数组 中 的 相对 次 序 相同 。 当 然 ， 仅 在 卫星 数据 随 被 排序 的 元 素 一 起 移动 时 ， 稳 
下 性 才 显 得 比较 重要 。 关 于 这 一 点 我 们 将 在 下 一 节 中 说 明 。 


9.3 ”基数 排序 


基数 排序 是 一 种 用 在 老式 穿 卡 机 上 的 算法 。 一 张 卡片 有 80 列 ， 每 列 可 在 12 个 位 置 中 的 
任 一 处 穿孔 。 排 序 器 可 被 机 械 地 “程序 化 "以 检查 每 一 选 卡片 中 的 某 一 列 ， 再 根据 穿孔 的 位 罩 
将 臣 们 分 放 12 个 盒子 里 。 这样， 操作 员 就 可 逐个 地 把 它们 收集 起 来 。 其 中 第 一 一 个 位 置 穿孔 
的 放 在 最 上 商 ， 第 一 个 位 置 穿孔 的 其 次 ， 等 等 。 

对 十 进 制 数 衬 来 说 ， 每 列 中 只 用 到 10 个 位 置 .〈 遇 两 个 位 置 用 于 编码 非 数值 字符 .) 一 
个 d 体 数 占用 d 个 列 。 因 为 卡片 排序 器 一 次 只 能 查看 一 个 列 ， 要 对 mn 张 片 上 的 d 位 数 进行 
排序 器 要 有 个 排序 算法 。 

直 感 上 ， 大 家 可 能 觉得 应 该 按 最 重要 的 一 位 排序 ， 然 后 对 每 个 盒子 中 的 数 递归 地 排序 ， 
最 后 把 结 且 合并 起 来 。 不 率 的 是 ， 为 排序 每 一 个 盒子 中 的 数 ，10 个 盒子 中 的 9 个 必须 先 放 
在 一 进 ， 这 个 过 程 产生 了 许多 要 加 以 记录 的 中 间 卡 片 堆 【 见 练 习 9.3 一 5) 

河 人 们 的 直 感 相反 ， 基 数 排序 是 首先 按 最 不 重要 的 一 位 数字 排序 米 解 决 卡片 排序 问题 
的 。 岗 样 ， 把 各 稚 卡 片 收 集成 一 选 ， 其 中 0 号 盒子 中 的 在 1 号 盒子 中 的 前 面 ， 后 者 又 在 2 号 
盒子 中 的 前 面 ， 等 等 。 然 后 对 整个 一 大 卡 片 按 次 重要 位 排序 ， 并 把 结果 同样 地 合并 起 来 。 重 
复 这 个 过 程 ， 直 到 对 所 有 的 d 位 数字 都 进行 了 排序 。 所 以 ， 仅 需要 n 遍 就 可 将 一 迭 卡 片 排 
好 序 。 图 9.3 说 明了 基数 排序 作 * 一 迁 ?7 个 三 位 数 的 过 程 。 第 一 列 为 输入 ， 其 余 各 列 示 出 了 
对 和 从 个 数位 进行 逐次 排序 后 表 的 情形 。 垂 直 向 上 的 箭头 指示 了 当前 要 被 加 以 排序 的 数位 。 


329 720 720 329 
457 二 55 329 355 
657 436 436 436 
839 一 437 二 839 二 457 
436 657 355 657 
720 329 457 720 
335 839 657 839 
T T 


图 :9.3 基数 排序 作用 于 一 个 由 七 个 兰 位 数组 成 的 衣 上 的 过 程 


关于 这 个 算法 很 重要 的 一 点 就 是 按 位 排序 要 稳定 。 由 卡片 排序 器 所 故 的 排序 是 稳定 的 ， 
但 操 作 员 在 把 卡片 从 盒子 里 拿 出 来 时 不 能 改变 他 们 的 次 序 ， 即 使 某 一 盒子 中 所 有 卡片 在 给 定 
列 上 的 穿孔 位 置 都 相同 。 
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在 一 台 和 典型 的 顺序 随机 存 取 计 算 机 上 ， 有 时 采用 基数 排序 米 对 有 多 重 域 关键 字 的 记录 进 
行 排序 。 例 如， 假设 我 们 起 根 据 三 个 关键 字 处 、 月 各 日 来 对 日 期 排序 。 对 这 个 问题 ， 可 以 用 | 
带 有 比较 函数 的 排序 算法 来 做 。 给 定 两 个 日 期 ， 先 比较 年 份 ， 如 果 相 同 ， 再 比较 月 份 ， 如 果 
再 相同 ， 就 比较 日 。 这 上 几 我 们 可 以 采用 另 一 个 方法 ， 即 用 一 种 稳定 的 排序 方法 对 所 给 信息 进 
行 三 次 排序 : 先 对 日 ， 其 次 对 月 ， 再 对 年 。 

基数 排序 的 代码 是 很 简单 的 。 下面 的 过 程 假 设 长 度 为 上 的 数组 A 中 的 每 个 元 素 都 有 d 
位 数字 ， 其 中 第 1 位 是 最 低 的 ， 第 d 位 是 最 高 位 。 


及 ADTIX-SODRTIA，9) 
1] for is-l to dd 
2 do 使 用 一 种 稳定 的 排序 方法 来 对 数组 A 按 数字 1i 进行 排序 


基数 排序 的 正确 性 可 以 通过 对 正在 被 排序 的 列 进行 归纳 而 加 以 证 明 ( 见 练习 9.3-3)。， 
对 本 算法 时 间 代 价 的 分 析 要 取决 于 选择 哪 种 稳定 的 中 间 排 序 算法 。 当 每 位 数字 都 愉 于 1 到 k 
之 间 ， 且 K 本 太太 时 ， 可 以 选择 计数 排序 。 对 na 个 d 位 数 的 每 -一 遍 处 理 的 时 间 为 BCnTk)， 
共有 台 过 ， 故 基数 排序 的 总 时 间 为 @(dn+kd)。 当 dd 为 常数 . = On) 时 ， 基 数 排序 有 线 
性 运行 时 间 ， 

某 些 计算 机 科学 家 倾 身 下 把 一 个 计算 机 字 中 所 含 位 数 看 成 是 @(lg mj。 上 其 体 一 点 说 ， 候 
设 共有 dlgn 位 数字 ，d 为 正常 数 。 这 样 ， 如 果 待 排序 的 每 个 数 恰 能 容 于 一 个 计算 机 字 内 ， 
我 们 就 可 以 把 它 视 为 一 个 以 为 基数 的 d 倍数 。 看 --- 个 例子 : 对 一 百 万 个 64 倍数 排序 。 通 
过 把 这 些 数 当 作 是 以 23 为 基数 的 四 位 数 ， 用 基数 排序 四 遍 就 可 完成 排序 。 这 与 一 个 虹 型 的 
etnlgn) 比较 排序 相 比 要 好 得 多 ， 后 者 对 等 一 个 参加 排序 的 数 约 要 lgn= 20 次 操作 。 但 有 
一 点 不 理想 ， 即 采用 计数 排序 作为 中 间 稳 定 排 序 算法 的 基数 排序 版 本 不 能 够 进行 原 地 置换 排 
序 ， 而 很 多 @tn lgn) 比较 排序 算法 却 是 可 以 的 。 因 此 ， 当 内 存 比较 紧张 对， 一 般 来 说 选择 
快速 排序 更 合适 些 。 


9.4 桶 排序 


平均 情况 下 椭 排 序 以 线性 时 间 运 行 ， 像 计数 排序 一 样 ， 桶 排序 也 对 输入 作 了 某 种 假设 ， 
因而 运行 得 很 快 。 具 体 来 说 ， 计 数 排序 很 设 输 和 人 是 由 一 个 小 范围 内 的 整数 构成 ， 而 桶 排序 则 
很 设 输入 由 一 个 随机 过 程 产 生 ， 该 过 程 将 元 素 一 致 地 分 布 在 区 间 [0，1H 上 ( 见 6.2 节 中 一 
致 分 布 的 含义 )。 

桶 排序 的 思想 就 是 把 区 间 [0，1) 划分 成 nm 个 相同 天 小 的 子 区 间 ， 或 称 桶 ， 然 后 将 于 个 
输入 数 分 布 到 各 个 桶 中 去 。 因 为 输 和 人 数 均匀 分 布 在 0，H 上 ， 所 以 一 般 不 会 有 很 多 数落 在 
-个 桶 中 的 情况 。 为 得 到 结果 ， 先 对 各 个 要 中 的 数 进行 排序 ， 然 后 按 次 序 把 各 辅 中 的 元 素 列 
出 来 即 可 ， 

在 帮 排 序 算法 的 代码 中 ， 假 设 输 和 是 个 含 n 个 元 素 的 数组 A， 且 每 个 元 素 满足 0< 
A 国 <1。 另 外 还 需要 一 个 辅助 数组 B[0..n--! 来 存放 链接 表 ( 桶 )， 并 假设 可 以 用 某 种 机 制 来 
维护 这 些 表 。 (11.2 节 介 绍 了 如 何 实现 关 于 链接 表 的 -一些 基本 操作 。 ) 
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再 C 氏 三 了 一 SODRTIAD) 
n< 论 nastb[ 太 ] 
Jar ie] ta 

do 将 W[ 搬 入 到 变 B 1nAA 国 ] 
Jr ie 有 雪 T 一 ] 

qa 用 插 和 排序 对 坟 BU] 进 行 排 谭 
糙 世 BIO0]，BT]，…，8[n 一 扫 按 央 泽 合谋 


呈 ， 上 


铬 9.4 示 出 了 桶 排序 作用 于 有 10 个 数 的 输入 数组 上 的 操作 过 程 。(a) 输 和 人 数组 
入 .10]。、(b) 在 访 算法 的 第 5$ 行 后 的 有 序 表 ( 硝 )》 数组 BIO0.. 引 。 彬 由 存放 了 区 间 上 7 10， 
(if+l) > 10 上 的 什 。 排 序 输 出 由 胡 SI，BH，…，8[ 呈 的 按 序 将 旺 构 虑 。 





妈 
| 0 1 
2 (| 十 >t2E 于 > 
3 2 | 十 ->[2 让 村 ->[23 村- 一 [人 j 
4 3 | 十 >B3L 
5 4 | | 
6 5 | | 
? 6 | 于 
4 7 | 于 -= 
9 sj 
10|.68 5] = 





蚀 94 HUCKET-SOR 下 刘 操 和 件 


此 说 明 这 个 算法 能 正确 地 开 作 ， 看 早 个 抑 素 AA[ 计 和 A 辐 。 如 果 它 们 落 在 同一 个 桶 中 ， 则 
实 们 在 输 惠 施 获 中 碳 着 正确 的 相 洒 次序 ， 因 为 它们 所 在 的 桶 是 采用 拭 人 排序 的 。 现 假设 它们 
洲 到 不 同 的 情 中 ， 设 分 别 为 Bi 1 和 B[ 门 。 不 所 一般 人 竹 ， 般 设 了 <j 在 算法 的 代码 中 ， 当 
第 皇 行 中 将 有 中 的 玲 并 咒 起 来 时 ， 梢 B[ 订 中 的 元 素 先 于 桶 B[ 中 的 苞 素 ，、 林 而 在 输出 序列 
中 A 和 对 二 六 [i。 现 在 要 证 明 AA 们 秋 辣 。 假 广 情 癌 绊 好 相反 ， 我 们 在 : 

一 上 和 A 打 1 2 
世上 nAI] 
一 了 
得 耶 盾 【因为 主 < 门 ， 从 面 证 明 棚 排序 能 正确 地 上 作 。 

狐 在 来 分 析 算 法 的 运行 时 间 ， 除 第 $ 行 外 ， 所 右 各 行 在 最 坏 情 况 的 时 间 都 是 On 。 第 
5 行 中 检查 所 有 桶 的 时 间 是 On)。 分 析 中 唯一 有 趣 的 部 分 就 在 于 第 5 行 中 插 人 排序 所 花 的 
上 训 | 。 

为 分 析 插 入 排 闻 的 时 语 代 价 ， 设 本 为 表示 本 B[ 中 二 素 个 数 的 随机 变量 。 因 为 插入 排序 
以 吹 时 间 运 行 《 见 1.2 节 )， 故 为 排序 桶 B 乓 中 元 素 的 期 日 时 间 为 E[Oo:- ) ]=O(Emn:])。 
姬 种 个 精 中 的 抽 有 元 素 排 序 的 总 期 昌 时 间 为 : 


一 122 一 


on =of Za (9.0 
为 了 求 这 个 和 式 ， 要 确定 每 个 随机 变量 nm, 的 分 布 。 我 们 正 布 n 个 元 素 ， 个 桶 。 基 个 
元 素 落 到 桶 Bi 的 概率 为 1Zn， 因 为 每 个 桶 对 麻 入 区 间 上 ，1D 的 17n， 这 种 情况 就 与 6.6.2 
节 中 投球 的 例子 很 类 做 : 有 个 球 【〔〈 匹 索 ) 和 个 僵 了 【( 桶 )， 竺 次 地球 都 是 独立 的 ， 月 以 
概率 p=tZn 沙 到 任 ~- 棋 中 。 这样 ，ni=K 的 代 率 就 服从 项 分 布 bi n，pb)， 其 中 数 为 
Enj=pp=1， 方 养 Varlnj=napfl-p) =1-1Zn。， 对 任 间 随机 上 操 X， 有 等 式 【6.30) 有 : 
E[n' ] 一 Varln ] 十 g [ao ] 


一 妨 () 
将 这 个 界 用 到 (9.1) 式 主 ， 得 出 桶 排序 中 的 插 人 排序 的 期 名 运 行 时 间 为 Ofto)。 因 而 ， 整 个 
桶 排序 的 期 望 运行 时 间 就 是 线性 的 ， 


9-t 比较 排序 的 平均 情况 下 界 


在 这 个 问题 里 ， 我 们 要 证 明 人 性 和 何 确定 的 或 随机 化 的 比较 排序 的 期 蜡 运 行 时 间 有 有 下界 Da 
nm)。 先 米 看 一 个 其 决策 树 为 T, 的 确定 线 较 排放 算法 A， 假 设 和 的 输 大 的 每 一 种 排列 玫 
是 等 可 能 的 ， 

a. 根 变 Ta 的 等 个 时 节点 都 标 以 在 给 定 的 随机 输入 直到 达 沪 节点 的 慨 率 。 证 明 : 恰 有 
nm 个 叶 节 点 标 有 17n， 其 他 的 标 有 有 0。 

b. 设 DT) 表示 一 棵 桂 工 的 外 路 径 长 谋 ， 也 就 是 说 ，DUT) 是 T 的 所 有 时节 点 深度 的 
和 。 设 工 为 一 棵 树 ， 其 时 子 数 长 >1， 并 设 RT 风 ET 为 工 的 有 、 霸 子 树 。 让 明 :_ DT) 
=DIORT) +DULT) -Hk。 

c 设 dm) 为 所 有 有 m 个 时节 点 的 树 的 DCT) 的 最 小 信 。 证 明 : de=min 。。 fdG) 
+d 人 (一 让 十 车 。 

(提示 : 考虑 -一 棵 能 取 此 最 小 值 的 ， 有 kk 个 呈 节 点 的 树 T。 没 j 为 RT 中 的 时 节点 数 ， 
k 一 为 LT 中 的 叶 节 点 数 。) 

d. 让 明 : 对 的 某 一 给 定 的 值 ， 图 数 itgi+tk-D (ki 在 1=k7 2 处 取得 最 小 值 。 
总 结 dk) =QGk iT。 

e- 证 明 : DT =Rnl lgnl))， 并 给 出 排序 n 个 元 过 的 期 课时 间 为 Don lg hy 的 结 
沦 。 

现在 来 考 嵌 一 个 随机 化 的 比较 排序 B， 我 们 可 以 将 产 策 树 模型 加 以 扩 诬 米 处 理 随 机 化 的 

箭 形 ， 方 法 是 采用 两 类 节点 : 普通 的 比较 节点 和 * 随 机 化 "节点 。 后 一 种 节点 模拟 了 算法 了 B 
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所 做 的 形 如 RANDOM(I，D 的 随机 选择 ; 该 类 节点 有 T 个 子女 ， 在 算法 的 执行 中 每 一 个 
被 选择 的 可 能 性 相同 。 

f 证 明 :; 对 任何 随机 化 比较 排序 算法 B， 存 在 一 个 确定 的 比较 算法 A， 平 均 情况 下 它 所 
做 的 比较 次 数 不 多 于 B。 


9-2 以 线性 时 间 做 原 地 置换 排序 


。 a. 假 设 有 一 个 由 个 记录 组 成 的 数据 要 排序 ， 每 个 记录 的 关键 字 的 值 为 0 或 1. 给 出 一 
个 排序 这 nm 个 记录 的 原 地 、 简 单 、 线 性 的 排序 算 荡 。 可 以 使 用 除 输 入 歼 组 之 外 的 阔 定 量 的 
存储 至 间 。 

b. 在 (ay 中 给 出 的 算法 能 否 用 来 在 OUbnj 时 间 内 对 有 bp 位 关键 字 的 nm 个 记录 进行 基数 
排序 ? 如 果 行 ， 说 明 如 何 做; 如 果 不 行 . 说 明 原 因 。 

c. 假 设 m 个 记录 中 的 每 一 个 的 关键 字 都 界 计 工 到 k 之 问 。 说 明 如 何 修改 计数 排序 ， 使 得 
可 在 Ona+k) 时 间 内 对 mn 个 记录 原 地 排序 。 除 输 人 数组 外 ， 可 另 用 Of) 的 空间 ， 


练 习 妃 


9.!-1 “ 半 一 个 排序 竺 法 对 应 的 次 策 树 中 ， 一 个 时 节点 最 小 可 能 的 深度 是 多 少 ? 
9.1-2 不 用 Stirliog 近似 公式 ， 给 出 〈1gal) 的 渐 近 确 界 “用 3.2 节 介 绍 的 技术 来 求 和 式 并 ” ,legi)， 

9.1--3 ”证明 : 对 长 度 为 n 的 ml 种 输入 中 的 至 少 -一 半 而 吉 ， 没 有 一 种 比较 排序 算法 有 线性 的 运行 时 
间 。 对 ni! 中 的 17m 部 分 而 音 驴 择 样 呢 ? 17 2 部 分 耻 ? 

9.4-4 兽 有 大 宣称 排序 n 个 数 的 下 界 Gin lg nj 不 适用 于 他 的 计算 机 环境 。 在 他 的 机 器 环境 中 。 在 一 
次 比较 aa 后 ， 程 序 的 控制 流 可 有 三 个 转向 ，a <ai，a = 和 aa。 请 通过 说 明 排 序 n 个 元 素 所 需 的 三 
路 比较 仍 为 Don 区 ma 来 证 明 他 是 链 的 。 

9.1-5 证 明 : 为 合并 两 个 各 会 mn 全 元 素 的 已 排序 表 ， 在 最 坏 下 情况 2n-1 次 比较 是 必 不 可 少 的 。 

9.1-6 现 有 nn 个 元 素 要 排序 。 该 序列 包含 a/K 个 子 序列 ， 每 个 包含 K 个 元 素 。 矢 个 子 序列 中 的 元 这 
都 小 于 后 继 子 序 列 中 的 元 素 , 大 于 前 续 子 序列 中 的 元 索 。 这 样 ， 只 要 对 各 子 序列 中 元 素 排序 就 可 得 到 对 束 
个 输 人 序列 的 排序 结果 。 证 明 : 这 个 排序 问题 中 所 需 的 比较 次 数 的 一 个 下 界 为 Qtn lg 


9.2-1 仿照 图 9.2， 图 示 出 计数 排序 作用 于 数组 A= <7，1，3，1，2，4，5。、7，2，4，3> 上 的 过 
程 . 过 

3.2-2 证 明 计 数 排序 是 稳定 的 ， 

95.2-3 人 恨 设 COUMNTING-SORT 过 程 的 第 9 行 中 for 循环 被 重 写 为 : 

9 for jz-1 to 1lengtbh[A] 

证 明 该 算法 仍 能 正确 工作 。 修 改 后 的 算法 是 否 稳定 ? 

9.2-4 和 概 设 排序 算法 的 输出 是 像 图 形 显 示 一 样 的 数据 流 。 请 修改 CoUNTING_SsORT， 使 之 除数 组 
和 和 CC 外 不 再 需要 其 他 额外 存储 即 可 产生 出 排序 结果 . 

9.2--5 请 给 出 一 个 算法 ， 使 之 对 给 冠 的 介 于 1 到 攻 之 疝 的 na 个 整数 进行 预 处 理 ， 并 能 在 00) 时 间 内 
回答 出 有 多 少 个 输入 整数 藩 在 区 间 有 ..b] 内 。 你 给 出 的 算法 的 预 处 理 时 间 应 是 On+k)、 


9.3-1 仿 拥 图 993。 示 出 基数 排序 RATDIX-SORT 作用 于 干 列 英 语 单 主 上 的 过 程 : COW，DOG， 
SEA，RUG，ROW，MOB，BOX，TAB，BAR，EAR，TAR，DIG，HIG，TEA，NOW，ROX， 
9.3-2 下 面 的 算法 中 亏 些 是 稳定 的 : 播 人 排序 ， 合 并 排序 ， 堆 排序 和 快速 排序 ? 给 出 一 个 能 合 任 何 排 
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译 算 法 都 稳定 的 方法 。 所 给 出 的 方法 带 来 的 额外 时 空 开 销 是 密 少 ? 
9.3-3 用 归纳 落 证 明基 元 排序 能 正常 工作 。 在 所 给 出 的 证 明 中 ， 哪 个 地 方 要 假设 中 四 排 库 是 稳定 的 ? 
9.3-4 说 明 如 鸽 在 Or) 时 向 内 排序 1 到 m 之 间 的 nm 个 整数 。 
9.3-5 * 在 本 节 的 第 一 行 盯 片 排序 算法 中 ， 为 排序 浊 位 十 进 数 ， 在 最 坏 情 况 下 钴 更 排序 及 遍 ? 最 坏 情 
沉 下 操作 员 贤 在 管 岂 礁 卡 片 ? 


9.4-] 仿照 图 994， 说 明 BUCKET-SORT 作用 十 数组 和 = <.79，.13，.16。，.- 硒 。 .39，、.20，.89， 
.53，.71，.42> 上 的 过 程 ， 

3.4-2 权 排 序 算 法 的 最 二 情况 运行 时 间 是 什么 ? 若 鉴 在 保持 其 线性 运行 时 间 的 加 时 使 量 林 情况 时 间 为 
On 谍 m， 要 对 算法 作 什 么 样 的 修改 ? ， 

9.4 一 3* 在 闺 位 网 中 有 器 个 点 ,Pi 一 <xi，Y >， 使 得 0<xi 十 多 乞 1，i= 1，2，…、n。 报 设 所 
有 的 贞 是 一 致 分 布 的 ， 症 即 ， 某 点 落 在 贺 的 任 一 区 域 1 的 慨 率 与 该 区 域 的 面积 成 让 化。 请 设计 一 个 四 (nm) 
期 训 时 间 的 算 汶 米 根 据点 到 原点 之 间 的 距离 4 = Je 二 六 对 了 个 点 排序 。 

39.4-4 * ”一 个 随 袜 变 避 X 的 慨 膏 分 布 图 数 P(xj 党 尽 为 Ps) =PrefX<sx， 根 设 一 个 由 m 个 数 构 成 的 
表 有 在 QI 时 间 内 可 计算 的 连续 概 认 分 布 函 数 了， 证 明 如 何在 线性 期 望 时 人间 内 排序 n 个 数 . 
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第 十 章 ” 中 位 数 和 顺序 统计 学 


一 个 由 恬 个 元 素 组 成 的 集合 的 第 i 个 顺序 统计 就 是 该 集合 中 第 ij 小 的 元 素 。 例 如 ，_ 一 个 
集 台 元 素 中 的 最 小 值 即 其 第 一 个 顺序 统计 《i= D); 最 大 值 即 为 其 第 i 个 顺序 统计 (im。 
一 个 中 位 数 非 瑟 式 地 说 即 该 集合 的 “中 间 点 "上 的 元 素 。 当 了 为 奇数 时 ， 中 位 数 中 唯一 的 
即 侦 在 i= (n+D “2 处 。 当 nm 为 偶数 时 ， 旭 存在 两 个 中 位 数 ， 分 别 在 i=ny 2 和 
tn 2 处 这样， 不 考虑 的 奇 企 性 ， 中 位 数 总 处 在 ij= 上 (nn 7y2 和 二 
f (n+1) 21 处 。 

本 章 研 究 从 一 个 由 虽 个 不 同 的 数 构成 的 集合 中 选择 其 第 ii 个 顺序 统计 的 问题 。 昌 然 为 方 
便 起 见 ， 假 设 了 该 集合 中 的 mn 个 元 素 是 不 同 的 ， 但 下 面 所 得 出 的 所 有 结论 都 可 推广 到 集合 
中 存在 重复 元 素 的 情形 。 我 们 可 以 如 下 形式 地 定义 选择 问题 

输入 : 一 个 售 n 个 (不 同 的) 的 数 的 集合 A 和 一 个 数 i， 1 乏 i 志 中 

输出: 恰 大 于 A 中 其 他 这 1 个 元 素 的 xfg A。 

选择 问题 可 在 O(n 地 mn) 时 间 内 解决 ， 因 为 我 们 斌 以 用 堆 排 序 或 合并 排序 对 mn 个 输 人 数 
排序 ， 再 在 输出 数组 中 标 出 第 ii 个 元 素 即 可 。 但 除 这 两 种 之 个 ， 还 有 更 快 的 算法 . 

在 10.1 节 中 ， 我 们 讨论 从 一 集 元 素 中 选择 最 大 元 素 和 最 小 元 素 的 问题 。 后 两 节 中 讨论 
一 般 选 择 问 题 。10.2 节 对 一 个 平均 情况 运行 时 间 的 界 为 O(n) 的 实用 算法 进行 分 析 ，10.3 节 
介绍 了 一 个 最 坏 情 况 时 间 界 为 O(n) 的 算法 。 


10.1 最 大 元 素 和 最 小 元 素 


阳 做 多 少 次 比较 才能 确定 一 个 有 nm 个 元 素 的 集合 中 的 最 小 元 素 ?9 可 以 很 容易 地 给 出 nm! 
次 比较 这 个 上 界 ， 明 译 查看 集合 中 的 每 个 元 素 ， 并 始终 记录 到 目前 为 止 的 最 小 元 。 在 下 面 的 
过 程 中 ， 假 设 待 查看 的 集合 存在 于 数组 A 中 ， 且 leoagth[A]= nm。 


MINIMUM(G) 
IT min < 一 各 [ 

2 for ic- 2 to lcogth [上 A] 
了 do 下 imin> 吉 人 

二 then tminmn 一 凡 [j 

3 Tetutrtt Tin 


问 样 ， 要 找 出 最 大 元 素 也 要 rn-!1 次 比较 。 | 

巡 外 还 有 没有 更 好 的 结果 呢 ? 没有 了 。， 因为 对 确定 最 小 元 的 问题 我 们 可 以 获得 一 个 m-] 
次 比较 的 下 界 。 我 们 可 以 把 任意 一 个 确定 所 有 元 素 中 最 小 区 的 算法 看 成 是 一 场 锦标 赛 。 每 次 
比较 都 是 锦标 赛 中 的 一 场 比 赛 ， 并 且 两 个 元 素 中 较 小 的 一 个 获胜 。 有 一 点 很 关键 ， 就 是 除了 
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获胜 者 之 外 ， 每 个 都 更 输 掉 至 少 一 场 比赛 。 可 见 ， 为 确定 最 小 元 而 所 做 的 n-1 次 比较 是 必 
须 的 。 故 从 所 执行 的 比较 次 数 来 看 ， 算 法 MINIUMUM 是 最 优 的 。 
上 面 分 析 中 很 令 人 感 兴趣 的 -点 就 是 确定 执行 第 4 行 的 期 望 次 数 。 问 题 6-2 曾 贤 求 证 
明 这 个 期 望 值 是 加 (lg ny) 。 


同时 找 最 小 元 素 和 最 大 元 素 


在 某 些 应 届 中 ， 要 求 找 出 售 个 元 素 的 集合 中 的 最 小 元 素 和 最 大 元 素 。 例 如 ， 一 个 画 
形 程序 可 能 会 要 求 变 换 一 组 数据 <X，Y> ，、 使 之 能 在 一 块 矩 形 显示 屏 区 或 其 他 图 形 输 出 设 
备 上 输出 。 为 做 到 这 点 ， 该 贺 形 程序 首先 要 确 和 给 x， 了 坐标 中 的 最 大 、 最 小 但。 

要 想 设计 出 一 个 能 用 渐 近 最 优 的 Qtnl 次 比较 就 找 出 nm 个 元 索 中 的 最 小 元 和 最 大 元 并 不 
困难 。 只 要 独立 地 求 最 小 区 和 最 大 元 ， 各 用 nm 一 1 次 比较 ， 共 做 2n-2 次 比较 划 可 ， 

事实 上 ， 仅 仅 用 [3n72 1 次 比较 就 可 找到 最 小 区 和 最 天 元 。 盐 做 添 是 ， 让 永 当 前 见 到 
的 最 小 元 和 最 大 元 。 我 们 并 不 是 将 每 一 个 输 和 元素 和 当前 的 最 大 元 和 最 小 元 比较 ， 而 是 以 每 
个 元 素 比 较 隔 次 的 代价 来 成 对 地 处 理 输 和 人 元素， 儿 将 一 对 输 人 元 泰 屯 相 比较 ， 人 然后 把 较 小 者 

与 当前 最 小 元 比较 ; 把 较 大 者 与 当前 最 太 元 冰 匀 ， 即 每 两 个 元 素 竟 毕 江 次 。 


10.2 ”以 线性 斯 望 时 间 做 选择 


一 般 选 择 问题 看 起 来 要 比 寻 求 最 小 元 的 简单 选择 问题 更 难 些 。 人 司令 人 惊 柯 她 是， 本 个 问 
题 的 淋 近 时 人 间 是 一 样 的 ; 都 是 @@(n)。 在 这 一 节 中 ， 我 们 要 介 绢 -一 个 用 来 解 次 选择 问题 的 分 
治 算法 RANPDOMIZED-SELECT。 该 算法 仿照 了 第 人 瘟 中 的 忆 速 排序 算法 。 像 在 快速 排 
序 一 样 ， 该 算法 的 思想 也 是 对 输 人 数组 进行 递 昱 划分 。 和 和 快速 排序 不 则 的 是 ， 它 只 是 灶 划 分 
的 某 一 边 进行 处 理 。 这 个 不 同 在 分 析 中 就 可 以 反 催 出 举 : 快速 排序 的 期 一 运 行 时 间 为 On teg 
n)， 而 RANDOMIZED-SELECT 的 期 望 时 间 为 罩 (n)， 

RANDOMIZED-SELECT 中 用 到 了 8.3 节 中 介绍 的 RANDOMIZED-PARTITIOF 
过 程 。 所 以 ， 像 RANDOMIZED-QUICKSORT -- 样 、 林 笠 法 是 全 随机 化 的 算法 ， 因 为 其 
性 能 部 分 地 由 一 个 随机 数 产生 器 的 输出 来 决定 。 以 下 是 RANDOMIZED-SELECT 的 人 擅 析 
码 ， 它 返回 数组 AIp. 了 中 的 第 个 小 的 元 束 ， 


只 ANDOMIZED-SELECT(A，p，r， 缮 
t 入 世 =f 

2 then retatn 各 提 ] 

3 qas-RANDOMIZED-PARTITIONIA，9，T) 

二 长 < 如 一 1 

5 这 1 过 攻 

扣 then retnotm RANDOMIZED-SELECTIA，P，9，i 

?了 else Fetbrn 及 AMNDOMTIZED 一 SELLEC IN，0 1，T，1 一 KK 


在 算法 的 第 3 行 中 执行 RANDOMTZED-PARTITION 后 ， 数 组 Ap-. 电 被 分 成 两 个 非 
空子 数组 Afp..q]j 和 Afq+1..0， 使 得 A[p..q] 中 的 每 个 元 于 都 小 下 AIq+1. 中 的 每 个 元 素 。 算 
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法 的 第 4 行 计算 子 数 组 Afp..q] 中 的 元 素 个 数 k。 现 在 算法 要 决定 第 小 的 元 素 落 在 两 个 子 数 
组 A[p..qg] 和 .AIq+1..9 的 哪 一 个 之 中 。 如 果 i 和 KK， 则 蓝 找 的 元 素 落 在 划分 的 低 区 中 ， 于 是 第 ， 
6 行 中 在 低 区 的 子 数组 中 进一步 递归 选择 ， 如 果 i>k， 则 训 找 的 元 素 就 落 在 划分 的 高 区 子 数 
组 中 。 因 为 我 们 已 经 知道 有 kk 个 值 小 于 Aip, 可 中 的 第 i 小 元 素 一 - 亦 即 ， 和 [pq 中 的 所 有 元 
素 一 所 求 元 素 必 是 A[q+1..0 中 的 第 《ixk) 小 元 素 ， 于 是 在 第 了 行 中 对 其 进行 递归 选择 。 

RANDOMIZED-SELECT 的 最 坏 情 况 运 行 上 里 间 为 @to] ， 即 使 是 要 选择 最 小 元 素 也 
是 这 样 ， 因 为 在 每 次 划分 时 可 能 极 不 走运 ， 总 是 按 所 余下 的 元 素 中 最 大 的 进行 划分 。 该 算法 
的 半 均 情况 性 能 较 好 ， 又 因 它 是 随机 化 的 ， 帮 没有 一 个 特别 的 输 人 会 导致 其 最 坏 性 态 的 发 

当 RANDOMIZED-SELECT 作 肌 于 一 个 含 mn 个 元 素 的 输 人 数组 上 上 时， 我 们 可 以 给 出 
其 期 望 时 间 的 一 个 上 界 TIn). 在 84 节 中 ， 我 们 曾 说 过 算法 RANDOMIZED-PARTI- 
FION 在 产生 划分 时 ， 其 低 区 中 含 上 个 元 素 的 概率 为 27n、 从 工人 个 匹 素 的 概率 为 17 D， 
ij 一 2，3，…，n 一 1。 候 设 TIn)y 是 单调 递增 的 ， 在 最 坏 情 况 下 RANDOMIZED-SELECT 
的 每 次 划分 中 ， 第 i 个 元 素 都 在 划分 的 较 大 的 一 边 . 这 样 就 得 递 好 式 : 

TOn) < TImax(1，n 一 由 十 和 TImax(k， nn 一 k) ) ) 小 On) 


妆 


(re- 十 2 人 T(ky》 hom 


帮 一 rnzra2l 


号 | 一 


驴 一 


>，Tk) TO 


= rn 


2 
也 


上 面 推导 中 由 第 一 行 到 第 二 行 是 因为 max(1，nDn 一 1]) =n 一 1， 上 有 
KK 和 著 攻 之 Tv 2 1 
maxtk，n 一 ki 一 车 k< fnyv21 
如 果 虽 是 奇数 ， 每 一 项 了 fny211，TC ray21+0D，、…，Tn-1y 在 和 式 中 各 出 现 
两 次 ;如果 是 偶数 ， 每 一 项 TU ny21+H，TCTny 2 HH2)，…，Ton-l 各 出 现 两 
次 ，TL fnyz2 1 只 表现 一 次 。 在 每 种 情况 中 ， 第 一 行 中 的 和 式 都 由 第 二 行 中 的 和 式 从 上 
方 限界 ， 第 二 行 到 第 三 行 是 因为 在 最 坏 情况 下 Ttn-D) = O@2)， 故 项 -TCD 可 被 项 
On 吸收 。 = 
我 们 许 蔡 换 法 来 艇 上 面 的 递归 式 。 假 设 对 满足 递归 式 初 始 条 件 的 某 个 常数 c， 有 Ttn) 
<cn。 由 这 个 归纳 假设 可 得 : 
Tin) < > ， ckT+TOm) 


km In>zi 


n 一 | rnyx3al=1 
<2( Zrk- 了 kj+ oam 
上 一 了 k = 1] 
2c 7 ] 
一 一 (> -Dan-s (rar21-D rnxz2j1+oOom) 
D 2 之 


< 人，oa 
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委 C 严 
因为 我 们 可 以 选择 足够 大 的 ec 使 得 eny 4H172) 能 支配 On) 项 。 
总 之 ， 任 意 的 顺序 统计 【无 盐 基 中 位 数 ) 平均 来 说 都 研 在 线性 时 间 内 确定 。 


10.3 ”最 坏 情 况 线性 时 间 的 选择 


现在 米 看 一 个 其 最 坏 情 况 运 行 时 间 为 Dln) 的 选择 算法 SELECT。 像 

- 民 ANDOMIZED-SELECT 一 样 ，SELECT 通过 对 输 人 数组 的 递归 划分 来 找 出 所 求 元 素 。 
但 该 算法 的 基本 思想 是 蓝 保 证 对 数组 的 划分 是 个 好 的 划分 。、SELECT 采用 了 确定 的 划分 算 

法 PARTEITION ( 见 8.1 节 )， 并 作 了 -点 修改 ， 把 划分 支点 元 素 作 为 其 参数 。 

SELECT 通过 执行 下 列 步 骤 来 确定 长 度 为 n 输 人 数组 中 的 第 i 小 的 元 素 : 

1. 将 输 人 数组 的 n 个 元 震 划 分 成 1 ny 5$4 组 ， 每 组 5 个 元 吾 ， 且 全 多 只 有 一 个 组 包 合 
余下 的 mmods 个 元 束 。 

2. 通 过 搬 人 排序 来 找 出 每 组 的 中 位 数 ， 并 取 其 中 间 元 素 . 【如 果 某 组 中 有 侦 数 个 元 ， 
则 取 两 个 中 位 数 中 较 大 考 。) 

3. 对 第 2 步 中 找 出 的 fn S 1 个 中 位 数 ， 递 归 调 用 SELECT 以 找 出 其 中 位 数 x。 

4. 用 修改 的 PARTITION 版 本 ， 按 x 来 对 输 人 数组 进行 划分 ， 设 k 为 划分 的 必 区 中 的 
玫 素 数 ， 则 n- 为 疝 区 中 的 元 素数 ， 

5. 若 ji 委 k， 则 在 低 区 递归 调用 SELECT 以 找 员 第 1 小 的 元 素 ; 和 否则， 若 i>k， 则 在 高 
区 找 第 《ij 个 最 小 元 素 。 


图 10.1 对 算法 SELECT 的 分 析 


为 分 析 SELECT 的 运行 时 间 ， 先 来 确定 大 于 划分 支点 泡 素 区 的 元 素数 的 一 个 下 界 。 图 
10.1 给 出 了 一 些 形 像 的 说 明 .。m 个 元 迪 由 小 贺 来 表示 、 每 组 占 一 个 棺 。 各 组 的 中 数 为 折 色 ， 
中 数 之 中 数 x 在 图 中 标 出 。 图 中 所 画 箭 头 是 由 较 大 元 素 指 向 较 小 的 元 素 ， 从 中 可 以 看 出 每 组 
五 个 元 素 中 在 x 右边 的 三 个 大 二 x 在 x 左 边 的 三 个 小 于 x。 所 有 大 于 x 的 元 素 以 阴影 背景 
衬 出 .第 2 步 找 出 的 中 位 数 中 ， 至 少 有 一 半 大 于 xx。 这 样 ，[ny7s ] 组 中 至 少 有 一 半 可 有 三 . 
个 元 素 大 了 和子 x， 除 了 那个 所 含 元 素 可 能 少 5 的 组 和 包 人 洛 x 的 那个 维 之 外 。 扣 除 这 两 组 ， 所 有 
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大 于 xx 的 元素 数 府 少 为 : 
3 5 mnZ51-2j> 了 一 6 
河 理 ， 小 和 王 x 的 元 索 至 少 布 3n7 10-6 人 个。 页 在 最 坏 情 况 下 ， 第 5 步 中 董 多 有 
7n 7 10+6 个 元 案 递 归 调 用 SELECT。 
现在 就 可 以 建立 一 个 关于 算法 SELECT 的 最 坏 情况 运行 时 间 Ttn) 的 递归 式 。 第 1， 
2， 和 4 步 要 花 On 时间。{ 第 2 砂 对 大 小 为 DI1 的 集合 要 调用 On) 次 揪 人 排序 .) 第 3 
步 诡 时 间 T fs 1)， 第 5 步 需 时 间 宇 多 为 TOn 7 101t6)， 若 假设 工 是 单调 递增 的 。 请 六 
意 洒 mo20， 有 有 7ny 10+6<n， 上 任何 合 80 个 或 更 少 的 元 素 的 输 人 需要 Of 时 间 ， 这 样 


可 得 递归 式 : 
Ta <180) 若 as 80 
TI [nsTD+T7nh710+ 人 十 On) 洒 n> 80 
通过 蔡 换 方法 我 们 可 以 证 上 明 此 运行 时 间 是 线性 的 。 假 设 对 某 常 数 e 和 所 有 的 天 所 80， 
有 Tirn)y 反 cn。 将 此 另 纳 假 设 代 到 上 曾 递 轨 趟 的 石 边 ， 得 : 
Tin) < 和 er si+et7n in0+6 二 On) 
Scan scT+3ceny 十 和 十 人 mn) 
过 geny 10 十 7Cc+Cn) 
委 CD 
因为 我 们 可 以 选择 足够 大 的 避 使 对 所 有 的 nn>80，cmny 10-7) 大 于 由 On) 其 摘 述 的 
函数 。 这 就 说 明 SELECT 的 最 坏 情 况 运 行 时 间 是 线 件 的 。 
和 在 - -个 比较 排序 算法 中 -一样 { 见 1 节 )，SELECT 和 RANDOMIZED-SELECT 
仅 遂 过 元 素 癌 的 比较 来 确定 它们 之 间 的 相对 次 序 。 这样， 这 商 个 算法 的 线性 时 和 间 性 态 就 不 是 
像 第 轧 草 中 的 排序 算法 那样 ， 是 对 输 人 作 某 种 鼻 设 的 结果 。 在 比较 模型 中 ， 排 序 需 要 mn 地 
nj) 时 间 ， 有 山 使 在 盏 均 情 况 下 也 是 这 样 〈 见 问题 91)， 所 以 在 本 章 的 引言 部 分 提出 的 排序 和 
索引 方法 的 歼 率 是 不 丙 的 。 


思 考 题 


te-1 已 排序 的 1 个 最 大 数 
一 个 会 唱 个 元 素 的 集合 ， 我 们 希望 能 用 一 个 基于 比较 的 算法 来 找 和 由 按 顺 序 排列 的 1 
个 最 大 元 素 。 请 找 出 能 实现 证 列 每 一 种 方法 的 、 具 有 最 佳 的 渐 近 最 趟 情况 运行 时 间 的 算法 ， 
并 分 本 区 种 方法 的 运行 时 间 。 
3. 对 输入 数 排 序 并 列 电 于 个 最 大 的 。 
b. 对 输 大 数 建 立 -- 个 优先 级 队 剂 ， 并 调用 EXTRACT-MAX 过 程 i 议 。 
<. 用 一 个 豚 序 统计 算法 找到 第 [个 最 天 元 案 , 然后 划分 输 人 数组, 再 对 工 个 最 大 数 排序 。 


10-2 带 权 中 位 数 
对 分 别 昌 有 〈 正 的 ) 仅 wm 的 与 个 不 同 元 周 xlsx2 ns 有 也， 一 1 这 个 
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无 素 的 中 伍 数 xl 满 旦 : 


iu | 一 


1 
2 WW 所 
及; 关 人 


,论证 xx xn 的 中 位 数 即 着 权 wi=1xn 的 xiG=1 2 …,n) 的 带 权 中 位 数 。 

b. 说 明 如 何 通 过 排序 在 On lgn)j 的 最 坏 情 况 时间 内 求 出 mn 个 元 素 的 带 术 中 位 数 ， 

c- 说 了 明 如 何 利用 一 个 线性 时 间 中 位 数 算 法 (如 10.3 节 中 介绍 前 SELECT 来 在 日 (m 时 间 
内 求 出 m 个 数 的 带 权 中 位 数 。 

邮局 位 置 和 思想 定 义 如 下 :已 其 卫 个 点 pp2 了 pn 及 与 它们 柯 联 系 的 权 ww，wa，…，w。 
我 们 希望 能 找到 一 个 点 区 不 一 定 是 nm 个 输 人 点 中 之 一 ), 使 和 式 wdp,) 最 小 ， 此 处 
d(a，hb) 是 指点 a 与 b 之 间 的 上 离 。 

d. 论 让 带 仅 中 倍数 是 一 维 朗 局 位 置 问题 的 最 侍 解 决 方案 【所谓 “一 维 "”， 是 指 各 点 都 是 实 
数 ， 点 a 和 b 之 问 的 臣 离 为 dta，b) = 上，bl )。 

ge. 找 出 二 维 邮 局 位 置 问题 的 最 佳 解 管 〔 这 时 每 点 都 是 {(x，y) 对 ， 点 a=(G，) 和 
b= (xz，y) 之 间 的 路 离 为 Manhattan 臣 离 :Ga，b]j 一 |x 一 X%2| 十 | 全 一 yd。 


10-3 小 型 噶 序 统计 


我 们 蕊 经 知道 , 为 从 nm 个 数 中 选 出 站 顺序 统计 , 算法 SELECT 在 最 坏 情 况 下 要 做 TO) 
次 比较 , 是 Tn) = 加 ), 但 由 名 一 记号 隐 合 的 常数 相当 大 。 当 i 相对 nm 来 说 较 小 时 , 我 们 可 实 
现 一 个 新 的 过 程 , 它 以 SELECT 作为 子 过 程 , 但 最 趟 情况 下 所 作 比 较 次 煞 更 少 : 

a, 摘 述 一 个 能 用 Uitnj 次 比较 来 找 出 nm 全 霸 素 中 第 1 个 最 小 光 素 的 算法 ， 此 处 未 
mn“2， 且 

Ttn) 若 m 过 i 
Uit) taxza+rubeza 十 工 (2j) 否则 

提示 : 由 [ ny24 对 分 离 的 两 两 比较 开始 ， 然 后 对 由 每 对 中 的 较 小 元 索 构 成 的 集合 作 
递 果 处 理 。 

b. 证 明 : Un =nHO(TI2i 这 CE iD) 

“证明 : 如 采 i 是 个 常数 ， 则 Uitn) 一 nHQO( 雹 D。 

dd 证明: 如 有 对 k 关 2 有 1i=nk， 那 么 WUiln) =nHOTCOn7 KK) jgk)。 


练 习 十 
10.4-1 证 明 : 找 n 个 元 开 中 的 次 最 小 元 在 最 坏 铺 况 下 要 用 n+ T En 1--2 次 比较 。 (提示 :同样 找 
最 小 元 .。) 


10.1-2 证明 : 要 间 时 找到 na 个 元 素 中 的 最 小 元 和 最 大 元 ， 在 最 坏 情况 下 T3n7 2 1 次 比较 是 必须 的 。 
(提示 ;考虑 有 多 少数 可 能 是 最 大 元 或 最 小 元 ， 并 考虑 一次 比较 对 这 些 计数 会 有 什么 影响 9 
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ti0.2-1 写 出 RANDOMIZED-SELECT 的 达 代 版 本 ， 

10.2-2 ”假设 我 们 用 RANDOMIZED-SELECT 来 选择 数组 A= <3，2，9，0，7，3、4，8，6，1> 
中 的 最 小 元 素 。 给 出 在 最 坏 情 况 下 的 划分 序列 。 ， 

10.2-3 在 存在 相同 元 素 时 ，RANDOMIZED-PARTITION 过 程 将 子 数组 AIp. 了 划分 成 画 个 非 窜 地 
数组 A[p.-q] 和 [q+T.T]， 使 得 A 中 ,.,g 中 的 每 个 元 都 小 于 等 手 入 [9q+1. 电 中 的 每 个 元 素 。 当 存在 相同 元 于 
时 ，RANDOMIZED-SELECT 能 正确 工作 吗 ? 


10.3-1 在 算法 SELECT 中 ， 欠 人 元 素 被 分 为 45 组。 如果 它 们 被 分 成 了 组， 该 算法 仍然 以 线性 时 间 工 
作 吗 ? 分 成 3 组 叉 坚 样 ? 

10.3-2 分析 SELECT， 证明: 如 果 mz38， 则 大 证 "中 数 之 中 数 "x 的 元 素数 与 小 二 xx 的 抑 素 数 至 少 为 

mhxvd4j， 
10.3-3 说明 如 衙 能 使 快速 排序 在 最 坏 情 况 下 以 On lgn) 时 间 运 行 。 

10.3-4 * ”假设 对 一 个 含 n 个 元 索 的 集合 ， 茶 算法 只 用 比较 来 确定 第 i 小 的 元 索 。 证 明 : 泡 须 另外 的 
比较 操作 ， 它 也 能 找到 比 i 沙 的 计 1 个 元 素 和 比 i 大 的 n-ji 个 元 素 。 

10.3~$ 给 定 一 个 关于 以 最 坏 情 况 线 性 时 间 求 中 位 数 的 子 程序 的 "黑箱 "， 请 生出 -- 个 能 解决 任意 师 谋 
统计 的 选择 问题 的 线性 算法 。 

10.3-6 一 个 含 m 个 元 素 的 祭 合 的 k 分 位 数 为 把 排序 的 集合 分 成 下 个 等 大 小 集合 的 kk 个 顺序 统计 。 
请 给 出 能 列 出 某 一 集合 的 k 分 位 数 的 DOn 过 k) 时 间 的 算法 。 

” .10.3-7 描述 这 样 一 个 On) 时 间 的 算法 ， 人 性 在 给 定 一 集 mn 个 不 同 元 素 和 一 个 正 整 数 契 和 时 ， 能 确 尖 
出 $ 中 的 最 接近 其 中 位 数 的 k 个 数 。 

10.3-8 设 X[1..o0] 和 Y[1.n] 为 两 个 数组 ， 每 个 都 包 售 nm 个 已 排 好 谋 的 数 。 请 给 出 一 个 求 数 组 式 和 站 
中 所 有 2n 个 元 素 的 中 位 数 的 算法 . 

10.3-9， 一 家 石油 公司 正在 计划 建造 一 条 由 东 向 西 的 筹 道 ， 该 管道 要 穿 过 一 个 有 nm 口 油 井 的 油田 ， 从 
每 口 井 中 都 有 一 条 喷 油 管道 沿 最 短路 径 与 主管 道 直接 相连 《或 南 或 北 )， 如 疼 10.2 所 示 。 给 定 各 个 井 的 x 
坐标 和 y 坐标 。 应 如 何 选 拔 主 管道 的 最 希 位 置 【即使 得 各 路 管 长 度 总 和 最 小 的 位 置 1? 证 明 最 优 位 岂可 在 线 
性 时 间 内 殊 征 。 





图 10.2 ”确定 使 得 南北 哮 口 的 总 长 度 最 小 的 东西 输油管 道 的 位 置 
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第 三 篇 数据 结 1 构 


集合 在 计算 机 科学 中 和 它们 在 数学 中 一 样 重要 ， 但 数学 中 的 集合 和 计算 机 科学 中 的 集合 
有 些 不 同 。 数 学 中 的 集合 是 不 能 变化 的 ， 而 计算 机 科学 中 的 集合 却 可 以 增 大 、 缩 小 或 随 着 时 
间 而 变化 ， 称 后 一 种 集合 是 动态 的 。 本 篇 的 五 章 介绍 在 计算 机 上 表示 和 操纵 有 穷 动态 集合 的 | 
一 些 基 本 技术 . 

不 同 的 算法 对 集合 操作 种 类 的 要 求 是 不 同 的 。 例如 ， 许 多 算法 只 要 求 能 将 元 素 插 人 和 集 
合 、 从 集合 中 删除 元 素 ， 以 及 测试 元 素 是 否 属于 集合 即 可 。 能 支持 这 些 操作 的 动态 集合 称 为 
字典 。 另 一 些 算法 需要 一 些 更 复杂 的 操作 。 例 如 ， 第 七 章 在 介绍 堆 数据 结构 时 引入 了 优先 级 - 
队列 ， 它 能 支持 将 一 个 元 素 择 和 人 一 个 集合 或 去 掉 集 合 中 最 小 元 素 的 操作 。 实 现 一 个 动态 集合 
的 最 好 方案 取决 于 所 要 支持 的 集合 操作 ， 


动态 集合 的 元 素 


在 动态 集合 的 典型 实现 中 。 每 个 元 素 都 由 一 个 对 象 来 表示 。 如 果 有 指向 该 对 象 的 指针 的 
话 ， 就 可 对 该 对 象 的 各 个 域 进行 处 理 。 (第 十 一 章 讨论 在 对 象 和 指针 不 是 基本 数据 类 型 的 程 
序 设 计 环境 中 如 何 来 实现 它们 的 问题 .) 某 些 类 型 的 动态 集合 假定 对 象 的 一 个 域 为 其 用 于 标 
识 的 关键 字 域 。 如 果 各 对 象 的 关键 字 才 不 相同 ， 我 们 就 可 把 动态 集合 看 成 是 一 个 关键 字 的 集 

。 一 个 对 象 中 可 以 有 卫星 数据 ， 它 们 随 对 象 的 其 他 域 一 起 移动 ， 但 在 集合 的 实现 中 用 不 到 
它们 . 另外 ， 一 个 对 象 还 可 包含 指向 集合 中 其 他 对 象 的 数据 或 指针 域 。 

某 些 动态 集合 假定 所 有 的 关键 字 都 取 自 一 个 全 序 集 ， 例 如 实数 集 ， 或 所 有 按 字母 顺序 排 
列 的 单词 组 成 的 集合 ， 等 等 。 (全 序 集 满足 三 分 性 ) 根据 全 序 就 可 定义 集合 中 的 最 小 元 ， 或 
找 比 某 个 元 素 大 的 下 一 个 元 素 。 二 


动态 集合 上 的 操作 


动态 集合 上 的 操作 可 分 为 两 类 : 查询 ， 返 回 有 关 集 合 的 信息 ; 修改 ， 对 集合 有 所 改变 。 
下 而 答 贡 一 二 型 的 操作 。 人 

SEARCH(S，k): 一 个 集合 S 和 关键 字 k， 返 回 一 个 指 疝 $ 中 元 素 的 指针 x， 人 使 
key[x] =k， 或 当 S 中 和 存在 这 样 的 世 素 时 返 加 NIEL.。 

INSERTIS，x): 是 个 修改 操作 ， 将 由 x 指 向 的 元 素 增 加 到 8 中 去 。 通常 都 假定 x 中 的 
域 都 已 被 初始 化 。- 

DELETELS，x): 是 个 修改 操作 ， 当 给 定 一 个 提 向 $ 中 元 素 的 指针 xx 时， 将 xx 从 8 中 
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去 掉 〈 注 意 这 个 操作 用 了 指向 元 素 的 指针 ， 而 不 是 关键 字 的 值 )。 

MINIMUMI(S): 是 一 个 全 序 尝 S 上 的 查询 ， 返 回 $ 中 具有 最小 关键 字 的 元 素 。 

MAXIMUMI(S): 是 一 个 全 序 集 $S 上 的 查询 ， 返 回 $ 中 具有 最 大 关键 字 的 元 素 。 

SUCCESSOR(S，x): 是 一 个 查询 。 给 定 其 关键 字 属 于 全 序 集 $ 上 的 某 元 素 x， 返 回 $ 
中 比 x 大 的 下 一 个 元 素 ; 当 x 为 最 大 元 素 时 ， 返 回 NIL. 

PREDECESSORIS，x: 是 一 个 查询 。 给 定 一 个 其 关键 字 属 于 全 序 集 $ 上 的 茶 元 素 X， 
返回 $ 中 小 于 x 的 前 一 个 元 素 : 当 x 为 最 小 元 时 返回 NIL。 

查 谭 SUCCESSOR 和 PREDECESSOR 常常 被 推广 应 用 到 具有 相同 关键 字 的 集合 上 。 
对 包含 n 个 关键 字 的 集合 ， 通 常 的 假设 是 调用 MINIMUM 一 次 后 再 调用 SUCCESSOR 
mn- 次 就 可 按 序 核 举 出 该 集合 中 的 所 有 元 素 。 

执行 一 次 集合 操作 的 时 间 通 常 是 按 集合 的 大 小 来 测度 的 。 例 如 ， 第 十 四 章 介绍 了 一 种 数 
掏 结 构 ， 它 能 支持 以 上 列 出 的 每 一 种 操作 ， 且 作用 于 大 小 为 的 集合 上 的 时 间 为 O(lg aa。 


内 容 综 述 


十 一 到 二 五 志 述 了 用 种 用 来 实现 动态 入 合 的 数据 结 梧 面 将 用 到 其 中 的 几 种 以 和 
造 一 些 高 效 的 算法 。 

第 十 一 章 介 绍 处 理 简单 数据 结构 如 栈 、 了 队列、 链表 以 及 有 根 树 等 的 基本 方法 。 这 一 章 还 
要 说 明 在 对 象 和 指针 不 是 基本 类 型 的 程序 设计 环境 中 如 何 来 实现 它们 。 这 部 分 内 容 对 接触 过 
程序 设计 课程 的 读者 应 该 都 是 热 悉 的 。 

第 十 二 章 介绍 哈 希 表 ( 亦 称 杂 凌 表 )， 这 种 结构 支持 字典 操作 INSERT，PDELETE， 和 
SEARCH。 在 最 坏 情 况 下 ， 为 做 一 次 SEARCH 操作 所 作 的 杂 读 需要 母 (由 时 间 ， 但 哈 希 表 
操作 的 期 望 时 间 却 是 D(UD)。 对 杂 凌 操作 的 分 析 要 用 到 概率 内 容 ， 但 这 一 章 的 大 部 分 内 容 不 
需要 这 方面 的 背景 知识 。 

第 十 三 章 介绍 二 叉 查 找 树 ， 它 支持 前 面 列 出 过 的 所 有 动态 集合 操作 。 在 最 坏 情 况 下 ， 作 
用 在 有 nm 个 元 素 的 树 上 的 每 个 操作 所 需 时 间 为 @(n)， :但 对 一 棵 随机 构造 的 二 又 查找 树 ， 每 个 
操作 的 期 望 时 间 为 O(lg mj。 二 叉 查 找 树 是 很 多 其 他 数据 结构 的 基础 

第 十 四 章 介 绍 红 -- 慰 树 ， 这 是 二 叉 查 找 树 的 一 种 变形 。 和 一 般 的 二 叉 查 找 树 不 同 ， 红 一 
黑 树 始终 有 着 良好 的 性 态 : 最 坏 情 况 下 它 其 支持 的 探 作 有 O( 地 器 的 运行 时 间 。 红 -- 黑 树 是 
平衡 查找 树 ; 第 十 九 章 要 介绍 另 一 类 平衡 查找 树 ， 称 为 B-- 树 。 虽 然 红 - 黑 树 的 机 制 有 点 复 
杂 ， 但 不 用 了 解 细节 也 能 知道 其 大 部 分 性 质 。 如 果 读 者 有 兴趣 读 一 下 程序 的 话 ， 将 会 得 到 很 
大 的 收获 。 

第 十 五 章 介 绍 如 何 增强 红 - 黑 树 ， 使 其 能 支持 除 上 面 所 列 出 之 外 的 一 些 操 作 。 首 先 ， 对 
红 一 景 树 增强 使 其 能 支持 动态 维护 一 个 关键 字 集 合 的 顺序 统计 。 然 后 ， 对 它们 作 另 一 种 增 
强 ， 使 之 支持 对 实数 区 间 的 动态 维护 。 
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第 十 一 章 “ 基 本 数据 结构 


本 章 讨论 通过 使 用 指针 的 简单 数据 结构 来 表示 动态 集合 的 问题 。 有 很 多 复杂 的 数据 结构 
可 用 指针 来 构造 ， 此 处 只 介绍 几 种 基本 的 : 栈 、 队 列 、 链 表 ， 以 及 有 根 树 。 另 外 还 要 讨论 一 
种 可 从 数组 合成 对 象 和 指针 的 方法 。 


11.1 栈 和 队列 


栈 和 队列 都 是 动态 集合 ， 其 中 可 用 PELETE 操作 去 掉 的 元 素 是 规定 好 的 ， 在 乒 中 ， 可 
去 抒 的 元 吉 是 最 近 插 人 的 那 一 个 : 栈 实现 了 一 种 后 进 先 出 { 或 称 LIFO) 的 策略 。 类 似 地 ， 在 队 


列 中 ， 可 去 挤 的 元 素 总 是 在 集合 中 存在 时 间 最 长 的 那 一 个 ,队列 实现 了 先进 先 出 (或 称 FIFO) 


石 。 栈 和 队列 可 以 用 几 种 方法 有 效 地 实现 ， 本 节 介 绍 如 何 用 数组 来 实现 这 两 种 结构 的 方 
法 。 


栈 


作用 于 栈 上 的 插 人 操作 称 为 压 人 (PUSH)， 而 删除 操作 则 常 称 为 弹出 (POP)。 这 两 个 名 
字 会 使 人 联系 到 实际 生活 中 的 栈 ， 例 如 在 餐馆 中 用 来 放 盘 子 的 、 娃 面 安装 了 弹 答 的 栈 。 在 这 
种 栈 中 ， 盘 子 被 弹出 的 次 序 和 它们 被 压 人 的 次 序 正 好 相反 ， 因 为 在 每 一 时 刻 只 有 最 顶 上 的 那 
只 表 子 是 可 取 接 的 。 

我 们 可 以 用 一 个 数组 S[1..o] 来 实现 一 个 至 多 可 有 nm 个 元 素 的 栈 ， 如 图 11.1 所 示 。 栈 元 
之 仅 出 现 于 浅 阴 影 位 置 。 (a) 栈 S 有 四 个 元 素 ， 顶 端 元 素 为 9。 (b) 在 调用 PUSH(S，17) 
和 PUSH(S，3) 后 的 栈 。{c) 在 调用 POP(S) 返回 最 近 被 压 人 的 元 案 3 后 的 栈 。 虽 然 元 素 
3 仍 出 现 于 数组 中 ， 但 它 已 不 在 栈 中 ; 顶端 元 素 为 17。 数 组 S 有 个 属性 toplS]， 它 标 向 最 近 
被 插 人 的 元 素 。 由 S 实现 的 栈 中 包含 元 素 S[1..top[S]， 其 中 S[1] 是 栈 底 元 素 ，S[top[S]] 是 栈 
顶 元 素 。 过 

5 6 | 24 5 3 2345 6 7 
:SETTT :EPE nn 


| ]=4# 有 丰 . | 人] 一 椰 
(ah) (b) tc) 
图 11.1 核 $ 的 一 种 数组 实现 


尝 topfS]=0 时 ， 栈 中 不 包含 任何 元 素 ， 因 而 是 室 的 。 要 检查 一 个 栈 是 否 为 空 可 以 用 查 
询 操 作 STACK-EMPTY。 如 果 试 图 对 一 个 空 栈 作 弹 出 操作 ， 则 称 栈 下 滋 ; 如 果 top[S] 超 过 
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了 na， 册 称 栈 上 洲 。 这 两 种 情况 通常 都 看 作 是 出 了 错误 。{( 在 我 们 的 伪 代 码 实现 中 不 考虑 栈 
的 溢出 问题 )。 
有 关 栈 的 几 种 操作 的 代码 如 下 : 


STACK 一 EMPTYISI 
1 这 tep[8=10 

四 then retur TRUE 
匀 &lSe Teturn 下 点 ILS 五 


PUSH(S，x) 
1 top[Ss< top[S+1 
2 久 [top[ 刁 ]- 一 x 


PDR(S) 

1 这 SSTAACR 一 EMPTYTS)} 

之 ther error “TIdEerElOw” 

3 else topfSj < -top[S] 一 1 

寻 retutn SrtogfSl+l] ” 


图 11.1 示 出 了 PUSH 和 POP 操作 的 结果 。 以 上 三 种 栈 操作 的 时 间 均 为 O(D)。 
队列 


我 们 把 作用 于 队列 上 的 INSERT 操作 称 为 ENQUEUE， 把 作用 于 队列 上 的 DELETE 
操作 称 为 DEQUEUE。 像 栈 操作 POP 一 样 ，DEQUEUE 也 不 需要 元 素 参 数 。 队 列 具 有 
FIFO 性质， 看 起 来 就 有 点 像 由 人 排 成 的 一 个 队 。 队 列 有 头 和 尾 。 当 一 个 元 素 人 队 时 ， 就 排 
在 队 尾 上 。 要 去 掉 一 个 元 素 时 ， 总 是 在 队 头 进行。 

图 11.2 说 明了 用 一 个 数组 QQ[L..o] 来 实现 一 个 至 狠 售 n 一 1 个 匹 素 的 队列 的 方法 。 

队列 具有 属性 headtQ]， 它 指向 队 刹 的 头 ， 它 的 另 一 个 属性 为 tailtQj， 它 指向 队 尾 ， 妓 
插 人 新 元 素 的 地 方 。 队 列 中 各 元 素 的 位 置 为 head[Q]，head[QH1，…，tailQH-1， 在 最 后 一 
个 位 置 进行 “ 卷 绕 ”， 即 队列 中 的 各 元 素 排 成 环形 ， 位 置 1 接 在 位 置 mh 之 后 。 当 
head[lQ] =taillQ 时 ， 队 列 为 空 。 刚 开始 的 时 候 ， 有 headflqQ] = taillo=1， 当 队列 为 空 时 ， 好 
果 试 图 从 中 删除 一 个 元 素 则 会 导致 队列 下 洪 。 当 head[Q]=taillQ]+l 时 ， 队 列 是 满 的 ， 这 时 
如 果 试 图 向 其 中 插 人 一 个 元 素 就 会 引起 队列 上 溢 。 

在 以 下 的 过 程 ENQUEUE 和 DEQUEUE 中 ， 省 略 了 溢出 检查 部 分 (练习 . 11.1-4 要 求 
读者 写 出 两 种 溢出 检测 的 代码 )。 


ENQUEUEIQ， 碳 

1 总 [tail[G]j< 

2 _ iftailQj=lengthIQ] 

了 tbhen tailf 忆 = 一 1 

4 else taillQj-taillQ]+i1 


DEQUEUE 
1 _xQlheadfQjl 
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2 诗 head[Ql =]lengt 世 [局 ] 

3 tben head[O< 一 1 

才 else head[fQ]*head[Q]+i 
汪 Teturn 马 


”图 11.2 中 示 出 了 ENQUEUE 和 DEQUEUE 操作 ， 它 们 的 时 间 都 是 D(1D)。 队 列 元 素 仅 
上 出现 于 浅 阴 影 位 置 上 . (al) 该 队列 有 五 个 元 素 ， 在 位 置 QI7..11] 上 。 (pb) 在 调用 . 
ENQUEUE(Q，17)，ENQUEUE(Q，3) 和 ENQUEUE(Q，35) 后 的 队列 构造 。(c) 在 调 
用 DEQUEUE(Q) 返回 先前 在 惧 首 的 关键 字 15 后 的 队列 构造 。 新 头 的 关键 字 为 6。 


La 46 7 8 2 0 1 





heedl 怠 | = 1 上 刘 [ 人 ] = 1 
1] 六 了 3 中 号 1 全 
2l3|5 让 二 区 讽 FSTeTsTsT4T 
和 四 


tail@]=3 headIO]=7 





1 2 34356 7 8 9 1 1L .2 
ao 25 本 司 6|9|s| 4|7| 
1 


tcilLC]= 3 Reod[G] = 8 
图 11.2 用 数组 QT1..423] 实 现 的 一 个 队 剂 





11.2 链 表 


链表 是 一 种 数据 结构 ， 其 中 各 数据 对 象 按 组 性 排序 。 数 组 中 各 元 素 也 是 排 成 线性 序 的 ， 
各 元 素 可 根据 下 标 来 确定 ， 但 链表 中 的 元 素 是 由 指向 它们 的 指针 来 决定 的 。 链 表 责 用 来 灵活 
地 表示 动态 集合 ， 且 支持 有 关 的 各 种 操作 . 

链表 中 的 每 个 元 素 都 是 一 个 包含 三 个 域 的 对 象 :一 个 关键 字 域 ， 两 个 指针 域 next 和 
prev。 当 然 ， 该 对 象 还 可 包含 一 些 卫 星 数 据 。 如 果 给 定 该 袁 中 的 某 元 素 x，next[x] 就 指向 链 
表 中 X 的 后 继 元 素 ， 而 preyfx] 则 指向 x 的 前 趋 元 素 。 如 果 prev[x]= NIL， 则 x 没有 前 趋 节 
成 ， 即 列表 的 头 。 如 果 next[x]= NIL， 则 xx 没有 后 继 节 点 ， 因 而 是 表 尾 。 属 性 headiL] 指 向 
表 的 第 一 个 元 素 。 如 果 headIL]=NIL， 则 该 链表 是 空 的 。 图 11.3 示 出 了 双 链 表 及 有 关 的 操 
作 。 (a) 表示 动态 集合 {1, 4, 9, 16} 的 一 个 双 链 表 工 。 链 表 中 每 个 元 素 是 个 对 象 , 包含 关键 字 
域 与 指向 前 后 对 象 的 指针 域 【以 箭头 表示 )。 表 尾 的 hext 域 与 表 冻 的 prev 都 为 NIL, 以 一 个 
斜 杠 表示 。 属 性 head[L] 指 向 表 头 。 (b) 执行 了 LIST-INSERT(L, zx, 其 中 keyfx]= 25 之 后 ， 
链表 以 一 具有 关键 字 25 的 新 对 象 作为 新 的 表 头 。 这 个 新 对 象 指向 关键 字 为 9 的 旧 表 头 。 
(c) 再 调用 LIST-DELETEIL, xj 的 结果 , 这 时 x 指向 关键 字 为 4 的 对 象 . 
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图 11.3 甬 链 表 帮 有关 的 操作 


一 个 列表 可 旦 好 几 种 形式 。 它 可 以 是 单 链 接 的 或 双 链 接 的 ， 可 以 是 已 排序 或 非 排 序 的 ， 
可 以 是 环形 的 ， 也 可 以 不 是 。 如 果 一 个 链表 是 单 链 接 的 ， 则 每 个 对 象 中 就 没有 指向 前 趋 的 
prey 域 。 如 果 一 链表 是 已 排序 的 ， 则 该 表 中 元 素 的 链接 次 序 就 对 应 于 各 元 素 中 关键 字 的 次 
序 ， 这 时 最 小 元 素 为 队 头 ， 最 大 元 素 为 队 尾 。 如 果 一 链表 是 非 排 序 的 ， 则 其 元 素 之 间 以 任意 
次 序 链接 。 在 一 个 环形 链表 中 ， 玫 头 元 素 的 prev 指针 指向 表 尾 元 索 ， 而 表 尾 的 next 指针 指 
向 表 头 元 素 ， 这 样 ， 表 中 的 所 有 元 素 就 排 成 了 一 个 环形 。 在 本 节 的 余下 部 分 ， 我 们 假定 所 处 
理 的 链表 都 是 无 序 的 和 双向 链接 的 。 


查找 链 类 


,下 面 给 出 的 过 程 LIST-SEARCHI(IL， 殷 采用 简单 的 线性 查找 来 找 出 链表 工 中 的 第 一 个 
具有 关键 字 k 的 元 素 ， 并 返回 指向 该 元 素 的 指针 。 如 果 表 中 没有 一 个 元 素 的 关键 字 为 k， 则 
返回 NIL。 对 图 11.3(a) 中 的 链表 ， 调 用 LIST-SEARCH(L，4) 返 回 指向 该 链表 第 三 个 元 素 
的 指针 ， 而 调用 LIST-SEARCH(L，7) 就 返回 NIL. 


LIST-SEARCHCUL，k) 

1 Xehead[L| 

2 while x - 寺 NIEL and key jx]ScKk 
3 .、 do .xnmext[x] 

十 Teturn 忒 


为 查找 一 个 具有 个 对 象 的 链表 ， 过 程 LIST-~SEARCH 的 最 坏 情 况 时 间 为 @(m， 即 
查找 整个 表 的 时 间 。 

对 链表 的 插入 操作 

给 定 一 个 新 元 素 x， 过 程 LIST-INSERT 将 x 插 到 链表 的 头 上 ， 如 图 11.3(b) 所 示 。 


LIST 一 INSERTIEL，z) 

1 next [x] <-head[I] 

2 让 headE]- 关 NTL 

3 then Prevfhead[I]]= x 
4 head[i]- 一 x 
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对 


5 prevlx 二 NIL 


一 个 售 愉 个 元 素 的 链表 ，LIST-INSERT 的 运行 时 间 为 OH)。 


对 链表 的 删除 操作 


下 面 的 LIST-DELETE 过 程 从 链表 世 中 删除 一 个 元 素 x。 它 根据 指向 工 的 指针 将 蒜 具 
表 中 去 掉 ， 并 对 有 关 撕 针 进 行 和 修改 。 如 果 希 望 删除 具有 给 定 关 键 字 的 元 索 ， 则 要 上 先 调用 
LIST-SEARCH 先 定位 到 该 元 素 。 


LIST-DELETEIL， 区 

1 让 ptev[xj 关 NIL 

2 then next[Pprevfx]j<-next[x] 
3 else heagd[L]nextxl 


”二 inext[xHNIL 


5 then prev[thext[xl]< -prev[x] 


图 11.3(@) 说 明了 从 链表 中 珊 除 一 个 元 素 的 操作 。LIST-DELETE 的 运行 时 间 为 O(D)， 
人 性 如 果 和 希望 删除 一 个 具有 给 定 关 键 字 的 元 案 ， 则 要 先 调用 LIST-SEARCH 过 程 ， 因 而 在 最 
坏 情 况 下 的 时 间 为 @(m)。 


哨兵 


对 于 LIST-DELETE， 如 果 我 们 忽 酷 在 表 头 和 表 尾 处 的 边界 条 件 ， 则 该 过 程 的 代码 会 
更 简单 些 . 


但] 


( 动 


te} 


( 直 


LIST-DELETEE， x) 
1 mextprev[xjnext[x] 
2 prev[ncxt[xjj previx] 


下 和 二 一 汪 - 








出 四] < 35 EL 二 ld ke 
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图 11.4 LIST-INSERT“ 和 LiST-DELETE' 操 作 


哨兵 是 个 旺 对 象 ， 可 以 简化 边界 条 件 。 例 如 ， 假 设 我 们 有 链表 工 和 一 个 对 象 nillL]， 后 
者 表示 NIL， 但 也 有 和 其 他 元 素 一 样 的 各 个 域 。 现 在 将 对 链表 算法 代码 中 出 现 的 每 一 次 对 
NEL 的 引用 ， 用 对 哨兵 元 素 nilIL] 的 引用 来 代替 。 这 样 就 可 将 一 个 双向 链表 变 成 一 个 环形 链 
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表 ， 哨 兵 元 素 nillL] 介 于 头 和 尾 之 间 ， 如 几 11.4 所 示 。 域 next[nillIL] 指 向 链表 的 头 ， 而 
prev[nillIL]] 指 府 表 尾 。 同样 她 ， 表 属 的 next 域 和 表 头 的 prev 域 都 指向 nil[LL。 因 为 ， 
next[nil[I] 指 向 表 头 ， 我 们 可 以 去 掉 属 性 headfL]， 把 对 它 的 引用 换 成 对 next[nil[I] 的 引 
用 。 一 个 空 链表 仅 售 哨兵 元 案 ， 因 为 这 时 next[nilILJ 和 prev[nillLj] 都 可 被 置 成 nil[L]. 
LIST-SEARCS 的 代码 和 原来 差不多 ， 但 对 NIL 和 head[L] 的 引用 如 上 所 述 地 胡 以 改 

变 。 

LIST 一 SEARCHIL， bo 

1 Xe next[mni[I . 

2 while x=a 训 开 ] amd key [xhFEKk 


3 出 Xe-next[x] 
4 Tettrtt XX 


现在 对 链表 元 素 的 删除 用 仅 含 两 行 代码 的 过 程 LIST-DELETE' 进 行 ， 面 插入 则 用 
LIST-INSERT 进 行 : 


LIST-INSERTL， 区 

1 _ next [x] = -next [nil[L 
2 brev nextfnil[Ljl 一 x 

3 hhext [nilfL]]=< 一 X 

4 brev[x]< nil[ 三 ] 


图 11.4 示 出 了 LIST-INSERT'“ 和 LIST-DELETE' 作 用 于 一 个 链表 上 的 结果 。 使 用 了 
哨兵 nillL] ( 重 阴 影 节点 ) 的 一 个 链表 革 即将 一 个 通常 的 双 链 表 变 成 一 个 环形 表 ，nil[ 吕 在 头 
和 局 之 间 。 属 性 head[L] 不 再 需要 ， 因 为 我 们 可 以 通过 next[nil[ILj 来 取 接 表 头 。 (a) 一 个 空 
表 。 (b) 图 11.3(aj 中 的 链表 ， 表 头 为 关 键 字 9， 表 尾 为 关键 字 1]。 (fcj 在 执行 
LIST-INSERTT ”′(L，x) 后 的 表 。 这 时 key[x]=25。 新 对 象 成 为 表 头 。 (d) 山 除 关键 字 为 
1 的 对 象 后 的 表 。 新 的 表 尾 为 具有 关键 字 4 的 对 象 。 

哨兵 元 素 基 本 上 不 能 降低 施 于 有 关 数 据 绪 构 上 的 各 种 操作 的 几 近 时 间 界 ， 但 它们 可 以 降 
低 常 数 因子 。 寿 循环 结构 中 使 用 哨兵 的 好 处 主要 司 得 代码 更 加 简 诗 ， 而 计 速 度 则 没有 什么 帮 
其 。 例 如 ， 采 用 了 哨兵 后 有 关 链 表 操 作 就 简化 了 ， 但 在 LIST-INSERT 和 LIST-DPELETE' 
过 程 中 只 节省 了 DID 了 时间。 在 另 一 些 情 锅 下 ， 采 用 哨兵 则 可 使 循环 部 分 的 代码 更 加 紧 诸 ， 
因而 可 以 降低 运行 时 间 中 项 n 或 项 mn 的 系数 。 

要 注意 不 能 不 加 区 列 地 使 用 哨兵 。 如 果 有 很 多 较 得 的 链表 ，、 则 使 用 哨兵 后 就 会 造成 存储 
的 浪费 。 在 本 书 中 ， 当 哨兵 真正 能 简化 代码 时 我 们 方 加 以 采用 。 


11.3 指针 和 对 象 的 实现 


有 些 语言 (例如 FORTRAN) 中 不 提供 指针 与 对 象 数据 类 型 。 那 么 如 何 实现 它们 呢 ? 这 一 
节 中 我 们 将 介绍 如 何在 没有 显 式 的 指针 数据 类 型 时 实现 链表 孝 据 结构 的 两 种 方法 。 


对 象 的 多 重 数组 表示 


时 一 组 其 有 相同 域 的 夺 象 ， 每 一 个 城 都 可 用 -- 个 数组 来 表示 。 图 11.5 说 明了 如 何 几 汪 ， 
个 数组 来 实现 图 11.3(q) 中 的 链表 。 由 数组 key，next 和 prey 表示 的 图 14.3(a) 中 的 链表 ， 
每 一 个 竖 条 代表 一 个 对 象 ， 其 中 存储 的 对 象 对 度 顶 部 示 出 的 数组 下 榨 ; 箭头 说 明了 应 如 何 米 
解释 它们 ， 减 防 影 对 象 位 置 包 食 了 表 元 素 。 变 量 直 记录 了 表 头 的 下 标 ， 数 组 key 中 存放 动 
态 集合 中 当前 所 有 的 关键 字 ， 曾 所 有 的 指针 则 存放 在 数组 next 和 prev 中 。 对 一 个 给 定 的 数 
组 下 标 x，Kkeyfxj，next[fxl] 和 prevlx] 就 共同 表示 了 链表 中 的 一 个 对 和 象 。 在 这 种 解释 下 ， 一 个 
指针 x 即 为 指向 数组 kevy，next，Pprev 的 共 拷 下 标 ， 
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交 11.5 链表 的 多 电 数 组 表示 


在 图 11.3(a) 的 链表 中 ， 尖 键 字 为 4 的 对 象 在 关键 字 为 16 的 对 蒙 的 后 面 。 对 应 地 在 图 
11.5 中 ， 关 键 字 4 出 现在 keyl2].F， 关 键 字 16 出 现在 key[3 上 ， 故 有 next[ 引 = 2， 
prev[21=$。 哩 然 常 数 NTL 出 现在 表 尼 的 next 域 和 表 头 的 prev 域 中 ， 我 们 通常 用 一 个 不 指 
自 娄 组 中 任何 一 个 位 置 的 整数 (例如 0 或 -中 来 表示 之 。 另 外 ， 变 量 工 中 存放 了 表 头 元 素 的 下 
标 。 

在 我 们 给 出 的 切 代 码 中 ， 方 括 导 钙 可 表示 数组 的 上 标 ， 又 可 表示 对 象 的 某 个 域 。 厅 管 到 
什么 解释 ，key[ 习 ，next[x] 和 和 prev[x] 的 含义 孝 与 实现 是 一 致 的 。 


对 象 的 单数 组 表示 


计算 本 存储 器 中 的 字 是 用 整数 0 到 M-~1 来 起 址 的 ，M 是 个 是 够 大 的 整数 。 在 许多 程序 
设计 语言 中 ， 一 个 对 每 占据 存储 中 的 一 组 连续 人 位置。 指针 即 指向 某 对 象 所 占 存储 区 的 第 一 个 
位 置 ， 后 续 位 置 可 通过 如 上 相应 的 偏 移 量 进 行 寻 址 。 

对 不 提供 显 式 指针 数据 类 型 的 程 皋 设计 环境 ， 我 们 可 以 采取 同样 的 策略 来 实现 对 象 。 例 
如 ， 几 11.6 说 明了 如 何 用 一 个 数 给 A 来 存放 图 11.3(a) 和 图 11.5 中 的 链表 。 每 个 表 元 素 是 在 
该 北 组 中 占据 一 个 长 度 为 3 的 连续 子 数 组 的 对 象 。 三 个 域 key，next 和 brey 对 应 于 偏 移 量 
0，1 和 2。 指 疝 一 个 对 象 的 指针 是 该 对 象 的 第 一 个 元 未 的 下 标 。 包 含 表 元 素 的 对 象 加 子 浅 阴 
影 ， 箭 头 示 出 了 表 序 。 一 个 对 象 占据 一 个 连续 的 子 数组 AUj.k]。 对 象 的 每 一 个 域 对 应 于 一 个 
从 0 到 上 -ij 闻 的 贪 移 量 ， 且 指向 对 象 的 指针 即 下 标 j。 在 图 11.6 中 ， 对 应 于 key，next 和 
prey 的 偏 移 量 分 别 为 0，1，2， 为 了 读 prevfil， 给 定 撕 针 ji， 将 指针 值 i 与 偏 移 量 2 相 加 ， 
则 读 到 Af+H2]。 

这 种 单数 组 表示 比较 灵活 ， 它 允许 在 同一 数组 中 存放 不 同 长 度 的 对 象 。 要 操纵 这 一 组 异 
构 的 对 象 要 比 操纵 一 组 同 构 的 对 象 ( 各 对 象 具 有 相同 的 域 ) 更 困难 。 因 为 我 们 将 要 讨论 的 大 多 
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数 阁 据 结 攀 都 是 相 周 的 ， 故 用 多 生 数 组 表示 就 可 以 了 。 
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玫 11.6 以 单一 数组 和 表示 图 11.3a) 和 图 11.5 中 的 链表 
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疼 11.7 ALLOCATE-OBJECT 与 FREE-OBJECT 过 程 的 效果 


分 配 和 释放 对 象 


为 向 -个 用 双向 链表 表示 的 动态 集合 中 播 人 一 个 元 素 ， 筑 要 分 隔 … 个 指向 链表 表示 中 当 
入 末 被 利用 的 对 旬 的 指针 。 这 样 ， 有 必要 对 链表 中 未 被 占用 的 对 对 空间 如 以 管理 ， 从 而 方便 
人 分配。 在 其 些 系统 中 ， 用 废料 收集 器 来 确定 哪些 对 象 是 未 用 的 。 有 许多 应 几 非 常 简单 ， 它 们 
可 以 将 末 使 弄 的 对 象 返 回 存储 管理 程序 。 下 耐 我 们 通过 一 个 由 多 重 数组 表 孙 的 双 链 表 的 例子 
米 讨论 对 辣 构 对 象 的 分 配 和 释放 (或 叫 老 申 ) 的 问题 . 

假设 多 各 数组 表示 中 数组 长 度 为 mi 在 任 一 时 刻 德 态 数组 包 合 nm 和 mm 个 元 罕 ， 即 有 T 个 
对 儿 表 未 目前 在 动态 集会 中 的 元 索 ， 侧 另 mo 个 元 素 是 空 采 的 ， 它 们 可 用 来 表示 将 要 插 人 
动态 集合 中 的 元 素 。 

我 们 把 空闲 对 象 安排 成 一 个 单 链表 ， 称 为 空腹 表 。 空 亲 表 公用 到 next 数组 ， 其 中 存放 
着 才 中 的 next 指针 。 该 空闲 表 的 头 被 置 于 全 局 变量 free 中 。 当 由 链表 工 表示 的 动态 集合 直 
为 空 时 ， 罕 闲 表 就 与 工 连 在 一 起 ， 如 图 11.7 所 示 。 (a) 园 11.5 中 的 表 ( 浅 阴 影 ) 和 一 个 自 
出 故 《 于 了 闲 影 )。 和 区 头 示 出 了 自由 表 结 构 。 fb) 调用 ALLOCATE-OBJECTO ( 它 返 加 下 标 
4)、 壮 keyt4] 为 25 和 调用 LIST-INSERTIL，4) 的 结果 。 新 的 自由 表 关 为 对 象 8， 它 原先 
为 片 由 表 上 的 nextf4]。 (ce) 在 执行 LIST-PELETEIL，5) 后 ， 调 用 FREE-OBJECT(5) 。 
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对 象 5 成 为 自由 表 新 的 表 头 ， 它 在 自由 表土 的 后 继 为 对 象 8。 注意 每 个 对 象 或 在 表 工 中 ， 或 
在 空闲 表 中 ， 但 不 能 同时 在 两 个 之 中 。 
空 病 表 是 个 栈 : 下 一 个 分 配 的 对 象 是 最 近 被 释放 的 一 个 。 我 们 可 以 用 楼 操作 PUSH 和 
POP 的 表 实 现 方式 来 分 别 实现 对 象 的 分 配 和 去 配 过 程 。 
在 下 面 的 过 程 中 ， 假 定 全 局 变量 free 指向 空 附 表 的 第 一 个 泡 素 。 
ALLOCATE-OBJECTO 
1] 对 free =MTL 
2 then error”Out OfSspace” 
3 else X free 
4 free <-nEx 针 x] 
5 Etut 办 其 


FREE-- 已 BJECTLx} 
1 区 eXt[LX] = 一 Tree 


2 free 一 人 


开始 时 ， 空 亲 表 中 包含 nm 个 未 分 本 的 对 象 ， 当 空闲 表 变 空 时 ， 过 程 ALLOCATE-OB- 
JECT 发 出 出 错 信 号。 一 般 来 说 ， 一 个 空闲 表 可 以 被 几 个 链表 所 共有 用。 图 11.8 示 出 了 三 个 
链表 和 一 个 空闲 表 通 过 数组 key，next 和 prey 交 碍 在 一 起 的 情形 。 
fce 嘻 AT 
me 
加 回避 加 轩 
1 [3] pe 一 国 汪 : 迟 国 志 
图 11.8 两 个 链表 L，( 线 归 影 }、L，{ 重 明 影 ) 和 一 个 自由 表 【于 的 ) 交 此 在 一 起 
上 面 两 个 过 程 的 时 间 代 价 为 O(D， 故 这 是 两 个 很 实用 的 过 程 。 要 想 司 它们 对 一 组 同 构 
的 对 象 也 适用 ， 收 改 的 办 法 是 让 对 象 中 的 某 个 城 作为 空 亲 表 中 的 next 域 来 使 用 。 


11.4 有 根 树 的 表示 






前 一 节 中 链表 的 表示 方法 可 以 推广 至 任意 同 构 的 数据 结构 上 。 在 这 一 节 里 ， 我 们 来 讨论 
用 链接 数据 结构 表示 有 根 树 的 问题 。 首 先 要 讨论 二 叉 树 ， 然 后 提出 一 种 适用 于 节点 的 子女 树 
为 任意 的 有 根 树 的 表示 方法 。 

我 们 用 一 个 对 象 来 表示 树 的 一 个 节点 。 对 链表 ， 假 设 每 个 节点 都 有 一 关键 字 域 ， 其 余 域 
包括 指 问 其 他 节点 的 指针 ， 等 等 。 


盖 久 树 


如 图 11.9 所 未， 我 们 用 域 p、left、 和 fight 来 存放 指向 父亲 、 左 上 子 和 石 儿 子 的 指针 . 
key 域 没 有 标 出 ， 如 果 pfx]= NIL， 则 x 为 根 。 如 果 节 点 x 无 左 儿 子 ， 则 leftfx]= NIL， 对 硬 
芒 子 也 类 做。 整个 树 T 的 根 由 属性 来 root[T] 来 指向 。 如 果 root[H= NIL， 则 树 为 空 。 
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渭 是 .9 一 棵 二 闻 树 于 的 式 


Fe 了 





闻 11.10 . 树 工 的 直接 了 、 布 兄 弟 长 而 


无 界 分 尺 的 有 根 树 


上 面 一 恤 树 的 天 东方 法 可 推广 至 氏 个 节点 的 上 女 数 全 多 为 党 车 的 任意 种 类 的 树 : 诈 域 
childi、child2，…，child 业 代 le 相 right 域 。 寻 树 中 短信 和 局 的 子女 荐 二 界 的 ， 则 这 
个 方法 就 不 通用 子 ， 因 为 我 们 无 法 理 先 知道 有 多 少 不 ( 多 重 数 组 表 寺中 的 数组 ) 昌 加 以 分 配 ， 
此 外 ， 即 使 节点 的 壬 女 数 攻 以 … 个 很 大 的 常 攻 为 界 ， 但 多 数 节 点 只 有 少量 的 闻 廊 ， 册 紧 浪 
赞 大 量 的 存储 守重 。 

值得 庆幸 的 是 ， 可 以 用 一 六 枉 来 很 方便 地 表 喜 号 有 和 硅 意 子 女 数 的 树 。 这 种 方法 的 优 所 是 
对 任意 含 n 个 节点 的 有 根 树 仪 用 Oo) 的 空间 。 这 种 表示 邯 左 护 子 ， 右 如 弟 表示 ， 姑 图 11.10 
所 天。 每 个 节 有 域 plxj 辣 1 )，jJeftehildjx] (在 下) 以 基 Fiht-sipiing 本 【和 且 下 )。 关 键 学 设 
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有 泵 出 。 像 先前 -- 样 ， 每 个 区 点 包公 一 个 父 懈 针 PP，roofT] 措 而 概 工 的 根 。 除 父 指 针 ， 短 个 
莒 到 电 有 小 个 指针 域 ; 

6 letttg 指 癌 节 点 x 的 最 严防 于 ， 

(right 一 siblingEx] 指 向 x 仅 右 迪 的 纪 弟 . 

奶 果 xx 没 有 孩子 ， 虽 lefcehild[x] =NITL: 如 果 xx 是 扶 伪 告 点 的 最 右 了 子女， 财 
fight-siblins[x = NIL. 


树 的 其 他 表示 
有 直 训 用 邹 外 一 野 方 法 来 表示 在 柑 柄 ， 缚 妇 ， 在 第 七 剖 中 ， 我 们 让 大 全 歼 组 如 上 下 标 


则 表示 大 上 完全 一 驻 树 的 排 。 将 在 第 一 一 章 中 下 更 的 得 忆 订 中叶 由 根 洗 布 ， 故 只 用 到 父 指 
入 ， 看 没有 指向 平 女 的 指针 。 共 外 还 有 很 多 其 化 的 方法 、， 这 样 哪 一 种 攻关 基体 的 应用 而 定 。 


if1-tfT 霄 的 比较 
对 下 圾 中 的 四 种 刻 表 ， 每 -种 动态 集合 操作 的 池 近 节 坏 请 况 运 行 对 问 是 件 么 ? 


和 FTEIELL。 3 


和 区 下 六 和 个 RE， 和) 
TPREDECESSORCLSO 


RAINIM LT 4 





MAXIMUMUL 


11-2 用 链表 实现 可 合并 性 


-一 个 订 合 并 徘 支 持 这 样 几 种 操作 :，MAKE-HEAP ( 创 娃 -个 空 的 可 合并 堆 1，IN- 
SERT、MINIMUM，BEXTRACT-MIN 和 UNION.， 说 明 在 下 列 每 一 情况 中 ， 如 何 用 链 
此 实现 可 合谋 谁 ， 注 意 归 尽 最 使 每 种 操作 商 效 。， 茹 分 析 每 种 操作 的 过 行 时 间 。 

a, 链 表征 排序 的 。 

b. 链 表 是 非 排序 的 。 

.链表 是 非 排 序 的 ， 太 待 合 并 的 各 到 态 集合 是 分 敲 的 。 


1--3 查找 紧 竣 的 排序 链表 


练习 11.3-4 莹 求 我 们 同 答 如 合 在 -个 数组 的 前 na 个 位 合 紧 无 地 维护 一 个 含 于 个 元 素 的 
发 。 盘 届 记 有 关键 字 均 不 相间 ， 扩 紧凑 表 是 排序 的 ， 即 对 i= 1，2，…，n， 若 next[j] 冯 
NIL， 有 key[ < keyfnexti 有 在 这 些 假 设 卜 ， 我 们 期 望 下 列 随 机 化 算法 能 以 少 于 线性 的 时 
问 搜 索 链 表 ， 
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COMPACT 一 LIST 一 SEARCHCL，k) 
1 js-heaxdi[L] 

2 ne-iength[E] 

3 且 hile 放 NILI，and Keyfij < 业 
4 do 入 RANBDOMI，n) 

5 评 key[i<key 乓 aond key < 天主 
看 tbhenm 1< 

了 < 一 忆 它 式 夺 [这 

] 这 key[ 计 王 故 

外 thenm return j 

心 


10 teturm MIL 


毁 时 上 面 代 码 中 的 第 4-6 行 被 略 去 ， 则 就 得 到 常规 的 搜索 排序 链表 的 算法 ， 其 中 下 标 i 
逐次 指向 表 的 各 个 位 置 。 第 46 行 的 作用 就 是 向 前 跳 到 一 个 随机 选择 的 位 置 j] 上 上。 如果 
key 和 大 于 key 上 加 县 小 于 k， 则 这 样 一 跳 是 有 好 处 的 。 这 时 ，j 在 表 中 所 标 出 的 位 置 对 通常 的 
搜索 算法 来 说 是 要 被 i 酷 去 的 。 因 为 该 链表 是 紧 疲 的 ， 所 以 我 们 知道 j 选择 1 到 n 介 的 任意 
一 个 数 就 指向 表 中 的 某 个 对 象 ， 而 不 会 指 到 空闲 表 中 去 .。 

a. 在 COMPACT-LIST-SEARCH 中 ， 为 什 么 要 假设 各 关键 字 是 不 同 的 ? 论证 当 表 中 

有 重复 的 关键 字 时 ， 随 机 地 向 前 史 位 从 渐 近 上 讲 不 一 定 会 有 作用 。 

为 分 析 COMPACT-LIST-SEARCH 的 性 态 ， 我 们 可 以 将 其 分 成 为 两 个 阶段 。 第 一 个 
阶段 具 包 括 在 表 中 随机 向 前 号 位 ; 第 二 阶段 如 通 澡 的 线性 查找 一 样 操作 

设 X 为 一 随机 变量 ， 它 刻 划 在 阶段 1 中 的 + 次 选 代 以 后 链表 中 位 置 了 到 期 望 的 关键 字 上 kk 
之 间 的 臣 离 。 

b, 论 证 : COMPACT-LIST-SEARCH 的 期 望 运行 时 间 为 QItHE[X)，t2 人 0 

c. 证 明 : EI 区 ,和 六 (1 一 rz/a) (提示 : 利用 等 式 (6.28))。 

d. 证 明 : 2 /人 t+ 上 。 


e. 证 明 : E[XJ4 和 ny (tt， 并 解释 这 个 式 子 为 何 符合 直觉 认识 。 
f 证 明 ，COMPACT-LIST-SEARCH 以 O(Vny) 的 期 望 时 间 运 行 。 


练习 十 一 
呈 - 
tt.4-1 仿照 加 tt14， 说 明 对 一 个 人 存 依 在 SL1..6] 中 的 、 开 始 时 为 空 的 栈 8， 抬 作 PUSH(S， 专 ， 
PUSH{S，1，PUSHIS，3)，PORIS)，PUSHK(S， 划 以 及 PDPIS) 的 结果 . 
11.1-2 说 明 如 何 转 一 个 数组 来 实现 两 个 栈 ， 使 得 两 个 后 中 的 元 素 之 各 不 到 村 ， 两 者 都 不 会 发 生 上 
详 。 1 PUSH 和 POP 操作 的 时 间 应 为 口 (1)。 

.]-3 仿照 图 11.2 说 明 对 存储 在 数组 QI1..8 中 的 ， 初 始 为 空 的 耻 列 喉 ， 以 下 各 操作 的 铺 果 
ENQUEUECQ 4)，ENQOUEUE(Q，UD，ENQUEUE(Q， 习 ，DEQUEUEIQI，BEBNQUEUE(Q， 8 和 
PEQUEUE(OQ)， 

.4 重 写 ENQUEUE 和 DEQUEUE， 使 之 能 处 理 队列 的 下 溢 和 上 上 滋 ，. 
lt.1--5 栈 的 播 人 和 删除 操作 都 是 在 一 端 进行 的 ， 而 队列 的 播 人 和 萌 除 却 是 在 两 头 进 行 的 。 另 有 一 种 
双 端 队列 (deque)， 其 商 端 都 可 作 播 人 和 删除 操作 。 对 于 一 个 昨 数 组 构造 的 双 端 队列 ， 请 写 出 四 个 完成 在 两 
端 进行 搬 人 秩 慢 除 的 CD 时 间 过 程 。 
11. 一 各 说明 刘 休 用 两 个 检定 芝 全 全 承 列 ， 生 他 术 有 闫 扣 年 的 这 行 时 间 。 
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11.1-7 ”说 明 如 何 用 两 个 队列 来 实现 一 个 栈 ， 并 分 析 栈 操作 的 时 间 代价 - 


11.2-1 动态 集 台 上 的 操作 [INSERT 能 否 用 一 单 链 表 在 DID 时 间 实 更 ?对 DELETE 操作 呢 ? 

11.2-2 ”用 一 单 链表 工 来 实 班 一 个 栈 。PUSH 和 POP 操作 的 时 间 仍 应 为 Of1)， 

El.2--3 用 单 链 表 工 来 实现 一 个 队列 。，ENQUEUE 和 DPEOUEUE 操作 的 时 间 诬 仍 为 DI1)， 

11.2-4 分 别 用 单 链表 、 环 链表 来 实现 字典 操作 INSERT，DELETE 和 SEARCH。 所 给 出 的 过 程 的 
运行 时 间 怎 么 样 ? 

11.2-5 动态 集合 操作 UNION 以 两 个 分 离 的 集合 S, 和 8, 为 输入 ， 办 出 集合 S$= Si US: 包含 了 8) 种 
S., 的 所 有 元 式 。 该 操作 常常 会 破坏 $ 和 &。 说 明 如 和 何 选用 一 种 合适 的 数据 结构 支持 在 OU 时间 让 的 
UNION 操作 。 

11.2-6 请 写 出 -- 全 不 用 哨兵 元 迪 而 将 两 个 单 链 的 、 已 排序 的 链表 合并 成 一 个 单 链 的 、 排 序 的 链表 的 
过 程 ， 然 后 写 一 个 利用 哺 乒 的 类 伏 过 程 。 比 较 两 个 过 程 伐 码 的 简洁 性 。 

11.2-7 请 给 出 一 个 对 售 an 个 元 素 的 单 链表 的 链 进行 送 转 的 ， 睛 有 电 (m 时 前 的 非 素 昭 过程。 除了 链表 
本 身 占 用 空间 外 ， 访 过 程序 促使 用 固定 量 的 存 癸 . 

11.2-8 * ”说明 如 傈 对 每 个 元 素 仅 用 一 个 指针 np[x]( 而 不 是 两 个 :next 和 prev] 素 实现 双 链 表 ， 候 谨 折 有 
索引 值 都 是 下 位 攻 数 ， 上 且 尝 尽 npE] 为 mx]= nextixJXORprevfxl]， 即 nexit[e] 和 prev[x] 的 位 性 或 (NILL 用 间 
来 表 击 )。 注 意 竖 说 明 取 接 表 头 万 需 的 信息 ， 以 及 作用 在 这 样 一 个 表 上 的 SEARCH、TNSERT 和 PELETE 
操作 。 另 请 说 明和 如 何在 O(D) 时 间 内 道 转 这 样 一 个 表 . 


11.3-1 请 画 出 序列 < 13，4，8， 雪 9，5，11> 存储 在 以 和 多重 数 组 表示 的 双 链 琢 中 的 形式 ， 另 而 出 在 单 
数组 表示 下 的 形式 。 

11.3-2 对 一 组 用 单数 组 表示 实现 的 同 柳 对 象 ， 写 出 过 程 ALLOCATE-OBJECT 和 
FREE--OBJECT. 

11.3-3 在 过 程 ALELOCATE-OBJECT 和 FREE-OBJECT 的 实现 中 ,为 什么 壮 或 重 冯 对 象 的 prev 生 ? 

11.3-4 我 们 常常 希望 一 个 双 链 表 中 的 所 有 元 素 在 存 梢 中 稻 紧 密 地 排列 ， 方 法 只 使 用 多 重 数组 表示 中 
的 前 im 个 下 标 位 置 (在 一 个 分 页 的 虚 存 计算 机 环境 中 情况 就 是 这 样 )， 请 说 明 如 和 实 现 过 程 
ALLOCATE-OBJECT 和 FREE-DOB3JECT 才能 使 这 种 表示 比较 紧 流 . 

11.3-5 设 工 是 一 长 度 为 mm 的 双 链 着 ， 存 铺 在 长 度 为 nm 的 数组 key、next 和 prey 中 ， 假 设 这些 数 组 由 
维护 双 链 空闲 宏 下 的 两 个 过 程 ALLOCATE-DBJECT 和 FREE-OBJECT 来 操 维 。 进 一 步 假 设 在 数组 的 
个 元 素 中 ， 有 站 个 在 表 工 中 ，n-m 在 室 附 表 中 。 请 写 出 一 个 过 程 COMPACTIFY-LIST(L，F)， 使 之 在 
给 定 了 表 工 和 空闲 表 下 后， 移动 工 中 的 元 素 使 它们 占有 数组 中 的 .1，2，…， 间 位置 ， 同 时 调节 空闲 表 F 
使 之 保持 正确 ， 并 占有 数组 位 置 mm+1，m+2，…，nh。 所 给 出 的 过 程 的 运行 时 间 应 该 是 四 (m)}， 吾 只 可 司 用 
畴 定量 的 额外 空间 。 二 


11.4-1 夯 出 由 下 列 域 表 示 的 、 根 在 下 标 二 处 的 二 叉 树 . 


> 
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11.4-2 请 写 出 一 个 Qtn) 时 间 的 递归 过 程 ， 使 之 在 给 定 一 合 昌 个 节点 的 二 叉 权 时， 打印 出 树 中 每 个 节 
点 的 半 键 字 。 

11.4-3 写 册 一 个 Do 时 间 的 非 递 归 过 程 ， 合 之 在 给 定 一 含 n 外 节点 秀 志 及 树 后 ， 印 出 符 中 每 个 节点 
的 关键 字 。 可 利用 胡 作 为 辅助 数据 结构 。 

11.4-4 对 用 尾 疗 的 用 左 孩 子 、 右 兄弟 表 汶 在 储 的 有 根 树 ， 本 出 一 个 Dj 时间 过 程 来 印 册 各 节点 的 半 
键 字 。 

11.4-4* ” 写 一 个 DO(m) 时 了 间 的 非 递 时 过 程 ， 使 之 在 给 定 一 告 mn 个 节点 的 二 及 树 后 ， 印 出 震 个 节点 的 基 
键 字 。 

11.4-6 * ”任意 有 根 树 的 左 该 子 、 右 吕 弟 表示 中 ， 每 个 节点 有 三 个 指针 :Jeft-child，right-sibling 和 
parcent。 从 尾 一 个 节点 出 发 都 可 到 达 其 父 节 点 长 所 有 的 子女 节点 .说明 如 知 用 两 个 指针 利 -一 个 布尔 值 米 取 
得 同样 效果 . 
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第 十 二 章 ”杂凑 表 


有 很 多 庶 用 要 用 到 公 支 持 字典 操作 INSERT，SEARCH 和 DELETE 的 动态 集合 。 例 
如 ， 编 译 程序 要 维护 -一 个 符号 表 ， 其 中 的 元 素 为 与 标识 符 对 应 的 字符 串 。 实 现 字典 的 -- 种 有 
效 数 据 结 梅 为 杂 央 表 。 在 最 坏 情 况 下 ， 在 杂 凌 表 中 查找 一 个 元 案 的 时 间 为 名 (n) ， 但 通 肖 来 
说 ， 杂 凑 技 术 的 效率 是 很 高 的 。 在 -一 些 台 理 的 假设 下 ， 在 杂 弟 表 中 查找 一 个 元 素 的 期 望 时 间 
为 DO(1) 。 杂 凑 表 是 通常 的 数组 概念 的 推广 ， 因 为 可 对 数组 进行 直接 导 址 ， 故 可 在 OU) 时 
间 上 内 取 接 数组 任意 位 置 上 的 内 容 。 第 12.1 节 进 一 步 讨论 了 直接 寻 扯 的 问题 。 如 昌 存 储 空 间 
允许 的 话 ， 我 们 可 为 每 个 关键 字 保留 一 个 位 置 ， 这 种 情况 下 可 应 用 直接 寻 址 技术 。 

有 时 ， 起 正 要 存储 的 关键 字数 与 可 能 的 关键 字 总 数 相 比较 少 ， 则 这 时 采用 杂凑 表 就 会 较 
直接 数组 寻 址 更 有 效 ， 因 为 杂凑 表 通 常 采用 --- 个 与 所 要 存储 的 关键 字 成 比例 的 数组 。 在 杂 凌 
表 中 ， 不 是 直接 把 关键 字 用 作 教 组 下 标 ， 商 是 根据 关键 字 计 算出 下 标 。12.2 节 介 绍 这 种 技 
术 的 主要 思想 ，12.3 节 介 绍 如 何 用 杂 凌 函数 从 关键 字 计 算出 数组 下 标 。 另 外 述 将 讨论 杂 廊 
技术 的 几 种 变形 .杂凑 "是 一 种 极其 有 效 和 实用 的 技术 : 基本 的 字典 操作 只 需要 O(1) 的 平 
均 时 间 ， 


12.1 直接 寻 址 表 
当 由 所 有 关键 字 构成 的 域 U 比较 小 时 ， 直 接 寻 址 是 一 种 简单 而 有 效 的 技术 。 假 设 某 应 


用 要 用 到 一 个 动态 集合 ， 其 每 个 元 素 都 有 一 个 取 自 域 U= {0，1，…，m- 匡 的 关键 字 ， 此 处 
中 是 不 很 大 的 一 个 数 。 另 假设 没有 两 个 元 素 具 有 相同 的 关键 字 。 


杰 怖 Ra 昌 目 二 十 让。 下 十 






青 夯 ， 


本 | 加 
| 
圭一 


而 ，m 让 上 | 





困 12.1 用 一 个 直接 村 址 表 工 实现 动态 集合 


为 表示 动态 集合 ， 我 们 采用 一 个 数组 (或 称 直接 寻 址 表 ) TI0.m-1]， 其 中 每 个 位 置 
(或 称 村 ) 对 应 域 U 中 的 一 个 关键 字 ， 图 12.1 给 出 了 示意 。 域 可 = {0，1，…，g 中 的 每 个 . 
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关键 字 与 才 中 的 一 个 索引 对 应 。 真实 关键 字 及 = {2，3，5， 寻 构成 的 集合 确定 了 表 中 包含 指 
向 元 素 的 指针 的 空位 。 另 一 些 重 阴影 的 空位 包含 NIL， 槽 攻 指 向 集合 中 具有 关键 字 上 的 元 
素 。 如 果 没 有 这 样 一 个 元 素 ， 则 TI = NIL. 
字典 操作 实现 起 来 弛 较 简 单 : 
DIRECT-ADDRESS-SEARCHCT，k》 
rctura TI 
DIRECT-ADDRESS-INSERTIT，7 
T[key[xpx 
DIRECT-ADPRESS-DELETE(T，x) 
Tikeyfxll--NIL 


这 几 个 操作 执行 得 都 很 快 ， 每 个 仅 需 O(1) 时 间 。 

对 于 某 些 应 用 、。 动 态 集合 中 的 元 素 可 放 在 直接 寻 址 表 中 。 亦 即 ， 不 是 把 每 个 元 素 的 关键 
字 及 卫星 数据 都 放 在 直接 寻 址 表 外 部 的 一 个 对 象 中 ， 再 由 表 中 某 个 槽 的 指针 指向 该 对 象 ; 现 
在 是 直接 把 对 象 放 在 表 的 槽 中 ， 从 而 节省 了 空间 。 此 外 ， 通 常 并 不 需要 存储 对 象 的 关键 字 ， 
因为 对 象 在 表 中 的 下 标 是 可 知 的 ， 从 而 可 得 其 关键 字 。 但 是 ， 如 果 不 对 关键 字 加 以 存储 , 贡 
我 们 必须 有 某 种 办 法 来 确定 某 个 模 是 各 为 空 。 


12.2” 杂 凌 表 


直接 寻 址 技术 存在 着 一 个 问题 : 如 果 域 很 大 ， 则 要 在 计算 机 中 存储 大 小 为 |U| 的 一 张 
表 工 就 有 点 不 实际 ， 或 不 可 能 。 还 有 ， 实 际 要 存 依 的 关键 字 集 合 久 相对 U 来 说 可 能 很 小 ， 
则 分 配给 T 的 大 部 分 空间 都 要 浪费 掉 。 在 这 种 情况 下 ， 用 杂 资 表 则 可 比 直 接 寻 址 表 减 少 很 
多 空间 。 具 体 地 ， 存 储 要 求 可 降 至 B4KI)。 这 时 在 杂凑 表 中 查找 一 个 元 素 仅 需 O(D) 时 
间 。 

在 直接 寻 址 方式 下 ， 具 有 关键 字 k 的 元 素 被 存放 在 档 k 中 。 在 杂凑 方式 下 ， 该 元 素 处 
于 hk) 中 。 即 用 杂凑 函数 h 根据 关键 字 & 计算 出 槽 的 位 置 。 函 数 将 关键 字 域 U 映射 到 
杂凑 表 Ti0.m-1] 的 槽 位 上 : 

h:，U-{0，1，…，m-4 

这 时 ， 我 们 可 以 说 一 个 具有 关键 字 的 元 素 是 被 杂凑 到 模 hk) 上 ， 或 说 h(k) 是 关键 字 
k 的 杂凑 值 。 图 12.2 给 出 了 形 像 的 说 明 ， 关 键 字 k。 和 L 被 映射 到 同一 空位 中 ， 即 发 生 了 旭 
擅 。 采 用 杂凑 函数 的 目的 就 在 于 缩小 需要 处 理 的 下 标 范围 ， 即 我 们 要 处 理 的 值 就 从 IDj 降 到 
m 了 ， 从 而 相应 降低 了 空间 开销 。 

这 种 方案 中 存在 着 两 个 关键 字 杂 凌 到 同一 覃 中 〈 即 发 生 磁 撞 ) 的 可 能 性 。 已 有 一 些 很 有 
效 的 技术 可 用 来 解决 磁 撞 问题 ， 

当然 ， 最 理想 的 解决 方法 是 完全 各 免 碰 撞 。 要 试图 做 到 这 -点 可 以 考虑 选用 合适 的 杂 次 
函数 hb。 有 一 个 主导 思想 就 是 使 h 显得 尽 可 能 地 “随机 "， 从 而 避免 或 至 少 最 小 化 ) 碰 挤 . 
实际 上 ， 术 语 “ 杂 姿 " 即 体现 了 这 种 精神 。 但 我 们 知道 ，|D|j> m， 故 必 有 两 个 关键 字 其 杂凑 
值 相 同 ， 所 以 要 想 完全 避免 柚 擅 是 不 可 能 的 。 那 么 ， 我 们 一 方面 可 以 使 杂凑 函数 尽量 “ 随 . 
机 *， 另 一 方面 仍 要 有 解决 可 能 出 现 的 磋 擅 的 办 法 ， 
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本 节 佘 下 的 部 分 介绍 一 种 最 简单 的 磋 擅 解决 技术 ， 称 为 拉链 法 。 第 12.4 节 要 介绍 另 一 
个 解决 方法 ， 称 为 开放 地 址 法 。 


天 丰 | ) 


-rw 






图 12.2 用 一 个 杂 凌 冰 数 h 将 关键 字 肌 射 到 杂 疙 表 空 位 中 


通过 拉链 法 来 解决 磁 撞 


在 拉链 法 中 ， 我 们 把 杂 姜 到 同一 槽 中 的 所 有 元 素 都 放 在 一 个 链接 表 中 ， 如 贸 12.3 所 
示 。 杂凑 表 的 每 个 空位 TD] 包 含 了 一 个 由 所 有 的 杂 资 值 都 为 j 的 关键 字 构成 的 链表 。 例 如 ， 
hx) =h(kD)，hfk) =hk) =h(k))。 档 j 中 有 一 个 指针 ， 它 指向 由 所 有 杂 资 到 j 的 元 素 
构成 的 链 玫 的 头 ; 如 果 不 存 在 这 样 的 元 素 ， 则 j 中 为 NIL， 


全 全 全 
二 
一 本- 


2 





图 12.3 ”通过 拉链 法 解决 碰撞 


在 采用 了 拉链 技术 来 解决 磁 擅 后 。 杂 次 表 工 上 的 字 和 与 操作 就 很 容易 实现 了 : 


CHAINED-HASH-INSERTCT，x) 
在 表 T[htkeyfx]) ] 的 头 部 揪 人 < 
CHAINED-HASH-SEARCH(T，x) 
在 表 Tihtk) ] 中 用 关键 字 去 查找 一 个 元 于 
CHAINED-HASH-DELETE(T，x) 
从 袁 Tihftkeyfzx])y ] 中 删除 x 


插 人 操作 的 最 坏 情况 运行 时 间 为 O(1) 。 查 找 操 作 的 最 坏 情况 运行 时 间 与 表 的 长 庶 成 正 ， 
比 。 下 面 还 要 作 更 详细 的 分 析 。 如 果 问 题 中 的 链表 是 双向 链接 的 ， 则 删除 一 个 元 素 x 的 操作 


-一 1 和 51- 一 


咱 在 DID 贞 间 内 完成 (如果 链表 是 单 链 的 ， 则 要 霸 表 Th(key[x]) ] 中 去 找 x， 从 面 道 过 调 
束 x 的 前 趋 的 next 指针 来 贿 除 x。 和 在 这 种 情 况 下 ， 删 从 和 搬 人 的 运行 时 间 基 本 相间 )， 


对 带 拉链 杂凑 的 分 析 


采用 了 拉链 法 后 杂 次 的 性 大 是 疆 样 的 呢 ?》 特 别 地 ， 划 查找 一 个 县 三 绽 守 天 建 衬 插 雹 素 昌 
多 民有 时 问 ? 

给 定 一 个 能 存放 nm 全 元 素 的 ， 具 有 im 个 槽 位 的 漆 滤 圾 下 ， 定 浆 开 的 莫 载 内 上 交 为 
nm， 寻 一个 链 中 笠 均 所 存储 的 元 素数 。 我 们 的 分 析 以 x 来 表达 , 亦 央 、 报 柑 当 nm 和 m 趋 
二 无 穷 大 时 ，。x 不 宏 〔 注 意 ,可 以 小 于 等 于 或 大 于 1 

带 拧 链 的 杂凑 的 最 坏 情 况 性 态 很 益 : 所 有 的 理 个 关 任 江都 灯 凑 到 加 一 个 柄 中， 产 补 出 
一 个 芭 谋 为 nm 的 链表 。 这 时 ， 最 坏 情 况 下 货 找 的 时 全 为 全 (nn 查 章 二 计 委 本 灌 陋 数 的 时 间 
-一 这 比 用 一 个 链表 来 链接 所 有 的 元 素 好 不 了 多 消 。 洱 然 、 我 们 并 不下 典 矿 从 滩 表 的 最 坏 情 
况 性 能 差 才 用 它 的 。 

菜 尖 方 法 航 站 鬼 性 态 曲 依 顿 于 所 选 的 杂 痰 冰 数 - - 般 情 沈 下 把 所 有 了 的 类 健 守 分 布 在 站 个 
槽 倍 上 的 均匀 程度 。12.3 节 要 讨论 这 些 癌 是 ， 日 前 我 们 能 定 任何 元 素 茶 凑 到 站 个 横 中 的 企 
一 个 的 可 能 性 是 相 朵 的 ， 肛 号 其 他 元 案 被 杂 羔 到 什么 个 贰 是 独 这 的。 我 们 称 些 假说 为 简单 -- 
致 杂 由 ， 

假定 可 在 QI 时 间 内 计算 出 杂凑 值 htk)， 从 调查 找 兵 有 关键 芝 为 上 的 郊 案 的 时 间 线 
性 地 依赖 于 圾 TIhfk) ] 的 长 度 。 先 不 考虑 计算 傈 凑 级 数 和 证 址 情 hk) 的 OU 时间， 我 们 
来 看 看 查找 所 能 期 望 查 找 的 元 素数 ， 革 为 比较 元 素 的 关键 汉 是 得 为 攻打 翌 仁 的 表 了 hk 中 
的 元 索 ， 分 两 种 情况 来 考虑， 在 第 一 种 情况 中 ， 查 找 不 成 功 : 表 中 纹 有 .一 个 元素 的 关 链 学 为 
KkK，。 在 第 .… 和 钟情 沈 中 ， 寿 牧 成 功 。 

定 还 12.1 对 -- 个 用 拉链 技术 米 解 决 磁 撞 揭 霖 肉 表 ， 在 简单 -一致 淡 的 假 证 下 ，-- 次 
不 成 功 的 但 找 半 均 需要 @(1+axj 的 时 间 。 

证 明 : 在 简单 一 致 杂 淡 的 假设 下 ， 任 何 关 键 字 kK 等 订 能 地 被 洪 汇 到 ma 个 情 的 任 一 个 忆 
中 。 国 和 而， 一 次 不 成 功 态 找 的 平均 时 间 就 是 对 和 mn 个 发 的 某 一 个 内 头 查 我 年 尾 的 下 坟 峙 
全。 这 样 一 个 琢 的 平均 的 度 即 装载 因子 az=ny 外 ， 所 以 ，- 一 次 厅 成 切 的 查找 尝 才 旧 检 查 
个 元 素 ， 总 的 时 间 (包括 计算 hfky 的 财 间 )》 为 @(i+o)。 

定理 12.2 在 简单 一 致 杂 沽 的 假设 下 ,, 对 用 拉链 技术 解决 磁 撞 的 杂 资 和， 下 均 情 况 下 
一 伺 成功 的 查找 需要 Gti+e)y 时 间 。 

证 阴 : 扫 定 我 们 此 查 找 的 关键 字 是 表 中 存放 的 mn 个 关键 衬 中 任何 一 个 的 可 能 性 是 相同 
的 ， 避 时 还 假定 CHAINED--HASH-1INSERT 过 程 把 一 个 新 元 素 插 在 表 尾 上 【( 根 拟 
12.2-3， 匹 论 新 捷 素 是 酝 人 到 开头 或 是 插 人 到 无 妊 ， 幸 均 的 成 功 查找 时 间 都 址 … 样 的 }。 党 
旨 找 的 起 素 捅 到 表 中 后 ， 一 次 成 巧 的 查找 所 期 望 检 查 的 元 素 要 较 该 元 素 插 人 前 多 工 { 国 为 每 
个 新 元 索 总 是 在 队 尾 插 人 )。 为 了 确定 期 齐 检 查 的 抑 素 数 ， 我 们 取 表 中 号 个 项 的 平 夫 ， 肯 项 
上 第 二 个 匹 素 所 要 搬 人 的 那个 琢 的 期 望 长 度 〈 计 二 yym， 这 样 ， 在 一 次 成 功 的 查找 中 要 检查 
的 拒 素 数 为 

1 ， i 一 1 1 二 ，， 
it 二) -1+ 二 了 G 一 了 


Din i=: 


一 1S2-- 


-人 拓 ) 人 ee 


相应 的 总 的 时 间 找 价 〈 包 括 计算 杂 亚 函 数 }》 为 BC+Hav7 2 172m) = 虽 Ha) 

以 上 的 分 析 说 明了 什么 ? 如 果 杂 次 表 中 槽 数 至 少 与 表 中 的 元 束 数 成 正比 ， 则 有 
n=Oltmy， 从 和 而 x=nvm=oOtl rm=GOf。 这 说 明 平 均 来 说 ， 查 找 操 作 需 要 常数 量 的 
耻 间 。 我 们 又 知道 揪 人 操作 在 最 坏 情 况 下 各 要 DID 时间， 删除 操作 最 坏 情 况 下 需 归 O(l) 
时 间 、 因 而 全 部 的 字典 操作 平均 情况 下 都 可 在 DID) 时 二 内 完成 。 


12.3” 淋 凑 函数 


在 这 一 节 里 ， 我 们 要 讨论 有 关 杂 凑 函 数 设 计 的 问题 ， 并 介绍 三 种 方案 : 用 除法 进行 杂 
凑 ， 用 乘法 进行 杂 资 ， 以 及 一 般 杂 次。 


好 的 亲 凑 本 数 的 特点 


一 个 好 的 杂凑 函数 应 〈 近 似 ) 满足 简 单一 致 分 布 的 假设 : 每 个 关键 字 等 可 能 地 杂凑 到 任 

一 个 措 中 去 。 更 形式 地 ， 假 设 每 个 关键 字 都 根据 概率 分 布 P 独立 地 取 自 于 域 0， 这样， 简 、 
单一 致 杂 凌 部 

Y PUk) = 工 ,，j=0，1， .上 一 1 (12.1) 


申 
khekj = 1 


但 通常 情况 下 没 法 检查 这 个 条 件 是 否 成 立 ， 因 为 P … 般 是 未 知 的 。 
偶尔 P 也 是 可 知 的 。 葬 如 ， 假 设 关 键 字 为 随机 实数 k， 它 们 独立 并 一 致 地 分 布 于 0 忒 
k<1。 在 这 种 情况 下， 杂凑 函数 
业 全) 天 | km 
就 满足 方程 《12.1)。 

”在 实际 中 ， 常 常 运用 启发 式 技术 来 构造 好 的 杂凑 本 数 。 在 这 种 过 程 中 ， 关 于 P 的 殷 制 
性 信息 是 很 有 用 的 。 例 如 ， 在 编译 程序 的 符号 表 中 ， 关 键 字 都 是 代表 程序 中 标识 符 的 任意 字 
符 串 。 在 一 个 程序 中 ， 常 常会 出 现 一 些 很 相近 的 符号 ， 如 pt 和 pts。 一 个 好 的 杂 资 函数 应 能 
减少 将 这 些 相近 符号 杂 凌 到 则 一 槽 中 的 机 会 。 

通常 的 做 法 是 以 尽量 独立 于 数据 的 外 形 特 征 的 方式 导出 杂凑 值 。 例 如 ,“ 除 法 杂凑 ” (下 
面 要 讨论 ) 玫 一 个 特定 的 质数 来 除 所 给 的 关键 宝 ， 所 得 余数 即 为 该 关键 字 的 杂凑 值 。 

最 后 ， 请 注意 某 些 关 于 杂凑 函数 的 应 用 可 能 会 殉 求 比 简单 一 致 杂凑 更 强 的 性 质 。 例 如 ， 
我 们 可 能 希望 某 些 很 近似 的 关键 字 具 有 截然 不 同 的 杂 凌 值 (第 12.4 将 定义 的 线性 探查 中 将 
昨 到 这 个 性 质 ). 


将 关键 字 解 释 为 实数 


多 数 杂凑 冰 数 假设 关键 字 域 为 自然 数 集 N= {0，1，2，…}。 如 果 所 给 关键 字 不 是 自然 
数 ， 则 必须 有 -种 方法 来 将 它们 解释 为 自然 数 ， 例 如 ， 一 个 字符 串 关 键 字 可 以 被 解释 为 按 通 


一 133- 一 


当 的 基数 记号 表示 的 整数 .这样 ， 标 识 符 Bt 可 被 解释 为 十 进 制 整 数 对 (112，116)， 因 为 在 
ASCII 字符 集中 ，p=112，t= 116。 然 后 ， 按 128 为 基数 来 表示 ，pt 即 为 〈112 . 128) ， 
+116= 14452。 在 任 一 给 定 的 应 用 中 ， 很 容易 设计 出 类 似 的 简单 方法 来 将 每 个 关键 字 解 释 为 
一 个 自然 数 。 在 后 面 的 内 容 中 ， 我 们 假定 所 给 的 关键 字 都 是 自然 数 . 


12.3.1 除法 杂 靖 法 


在 用 来 设计 杂 \ 涤 函数 的 除法 杂 凌 法 中 ， 通 过 取 上 除 以 mm 的 余数 来 将 关键 宇 k 肌 射 到 mm 

个 档 的 某 一 个 中 去 。 该 杂 匡 数 为 
hf(kj) 一 k mod m 

例如 ， 如 果 杂 凑 表 的 大 小 为 吕 = 12， 所 给 关键 字 为 = 100， 则 htk) =4。 这 种 方法 只 
要 一 次 除法 操作 ， 所 以 比较 快 。 

当 应 用 除 靶 杂 站 时 ， 要 注意 im 的 选择 。 例 如 ，m 不 应 是 2 的 笑 ， 因 为 如 果 钙 =2， 则 
hxc) 就 是 k 的 个 最 低位 数字 。 除 非 我 们 率先 知道 ， 关 键 字 的 概率 分 布 使 得 的 各 种 最 低 
p 位 的 排列 形式 的 可 能 性 相同 ， 理 则 在 设计 杂 六 本 数 时 最 好 考虑 到 关键 字 的 各 位 的 情况 、 
外 ， 如 果 某 应 用 是 处 理 十 进 制 数 关 键 字 的 ， 则 mm 也 要 避免 到 10 的 赛 次 ， 因 为 这 时 杂 站 数 
只 取决 于 关键 字 的 某 几 位 数字 。 最 后 ， 可 以 证 明 当 理 = 2"-1，k 为 按 基 数 2 解释 的 字符 申 
时 ， 两 个 几乎 相同 的 字符 串 〈 除 了 某 两 个 相 邻 的 字符 的 次 序 不 同 外 ) 将 杂凑 到 同一 个 槽 中 . 

可 以 选 作 m 的 值 常常 是 与 2 的 蹇 不 太 接近 的 质数 ， 例 如 ， 假 设 我 们 要 分 配 一 张 杂 资 
表 ， 并 用 拉链 法 解决 ， 表 中 大 约 要 存放 nmn= 2000 个 字符 让 ， 每 个 字符 有 8 位 一 次 不 成 功 
的 查找 大 约 杰 检查 3 个 元 素 ， 但 我 们 并 不 在 意 ， 故 分 配 杂 站 表 的 大 小 为 下 =701. 之 所 以 选 
择 701 这 个 数 是 因为 它 是 个 接近 = 一 20007 3 但 不 接近 2 的 任何 释 次 的 质数 ， 把 每 个 关键 字 
k 视 为 一 个 整数 ， 则 我 们 有 杂凑 卫 数 : 

ho =kmod 701 


12.3.2 ” 红 法 杂 姜 法 


构造 杂凑 函数 的 滋 法 方法 包含 两 个 步 标 。 第 一 步 ， 用 关键 字 k 乘 上 常数 A(0<A<1)， 
并 抽取 出 kXA 的 小 数 部 分 ， 然 后， 用 称 以 这 个 值 ， 取 结果 的 底 。 杂 闪 画 数 为 

htk)j = LimtkAmod 1i)J 同时 
其 中 必 A mod 1* 即 A 的 小 数 部 分 ， 亦 区 kA-L kAJ- 

称 法 方法 的 一 个 优点 是 旭 的 选择 没有 和 什么 特别 的 要 求 。 对 某 个 p， 一 般 选 择 它 为 
2- 联 = 如 的 者， 这 是 因为 我 们 可 以 在 大 多 数 计 算 机 上 很 方便 地 实现 杂 次 函数 。 慢 设 某 计 算 
机 的 字 长 为 w 人 位， 而 k 正 好 可 容 于 一 个 字 中 。 敌 照 图 12.4， 我 们 先 用 w 位 整数 | 和 -27 
悄 上 k， 其 结果 为 2w 位 的 值 "2*-+ru， 其 中 + 为 积 的 高 位 字 ，5m 是 乘积 的 低位 字 。 所 求 的 
p 位 的 杂 普 值 中 包含 了 m 的 p 位 最 重要 的 位 。 

虽然 这 个 方法 对 任何 的 A 值 都 适用 、 但 对 某 些 值 效果 更 好 。 最 佳 的 选择 与 待 杂 疙 的 数 


据 特 征 有 关 。Knuth 对 A 的 选择 问题 作 了 细致 的 讨论 ， 并 认为 
As (y5 一 1 /2=0.6180339887… 【12.2) 


是 个 比较 理想 的 值 。 
例如 ， 如 果 有 kk= 123456，m= 10000， 且 A 取 等 式 12.2) 中 的 值 ， 则 : 
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1 10000 . (123456 .0.61803… mod 妇 ] 
| 10000 (76300.0041151… mod 1)] 
| 10000 - 0.004115…] 

1 41.1S1…] 

一 41 


hk) 


| 





“图 12.4 杂 姜 的 染 法 方法 


12.3.3 全域 杂 焉 


如 果 让 某 个 与 你 作对 的 人 来 选择 要 杂 凌 的 关键 字 ， 那 么 他 会 选择 全 厅 凌 到 问 一 槽 中 的 n 
个 关键 字 ， 使 得 平均 的 检索 时 间 为 @B(n) 。 任 何 一 个 特定 的 杂 凌 函数 都 可 能 出 现 这 种 最 坏 情 
况 性 态 ; 唯一 有 效 的 改进 方法 是 随机 地 选择 杂凑 函数 ， 使 之 独立 于 要 存 铺 的 关键 字 。 这 种 方 ， 
法 “( 称 作 全 域 杂 凌 ) 的 平均 性 态 很 好 ， 不 管 关键 字 如 何 选 择 。 

全 域 杂 资 的 基本 思想 是 在 运行 时 间 从 一 族 仔 细 定 义 的 函数 中 随机 选择 一 个 作为 杂 站 函 
数 ， 就 像 在 快速 排序 中 一 样 ， 随 机 化 保证 了 没有 一 种 输入 总 导致 最 坏 情况 性 态 。 同 时 ，。 随 机 
化 使 得 算法 在 每 一 次 执行 时 的 性 态 都 不 一 样 ， 即 使 是 对 同一 个 输入 。 这 种 方法 可 以 确保 算法 
的 平均 情况 性 态 较 好 ， 无 论 输 人 什么 样 的 关键 字 。 再 看 编译 程序 中 符号 表 的 例子 。 在 全 城 杂 
凑 方 法 中 ， 程 序 员 对 标识 符 的 选择 就 不 会 总 导致 较 差 的 杂 并 结 果 。 

设 本 为 有 穷 的 一 组 杂 站 函 数 ， 它 将 给 定 的 关键 字 域 U 映射 到 {0，1，…,. mr- 寺中 。 这 
样 的 一 个 函数 组 称 为 是 全 域 的 ， 如 果 对 每 一 对 不 同 的 关键 字 x，yE U， 满 足 ho =h(y) 
的 杂 琅 函数 hkE 百 个 数 正 好 为 | 莒 / mm。 换言之 ， 如 果 从 H 中 随机 地 选 -一 个 杂 疲 函数 ， 当 x 
夫 y 时 两 者 发 生 磁 挤 的 概率 恰 为 1 /ma， 这 也 正好 是 从 集合 {0，1，…， 了 mn- 寺中 随机 遂 择 
htxo) 和 hty) 时 发 生 碰 拉 的 概率 - 四 

从 下 面 的 定理 中 我 们 知道 全 域 杂 泪 函 数 类 的 平均 性 态 是 比较 好 的 。 

定理 12.3 如果] 选 自 -一 组 全 域 的 杂 资 函数 ， 并 用 来 将 n 个 关键 字 杂 凌 到 一 大 小 为 下 
的 表 中 ， 此 处 mn<m,，: 则 关于 某 个 特定 的 关键 字 x 的 预期 碰撞 次 数 小 于 !， 

证 明 ， ， 对 每 一 对 不 同 的 关键 字 y，z， 设 cyz 为 随机 变量 ， 当 h(y) =hz) 时 cyz 为 : 
(在 采用 杂凑 函数 时 y 和 z 发 生 磁 擅 )， 否 则 为 0。 又 因为 根据 定义 ， 一 对 关键 字 发 生 磁 所 
的 概率 为 17 m， 则 有 : 

PEic,j]=17m 

设 C, 是 在 包含 n 个 关键 字 、 大 小 为 的 末末 中 从 小 到 的 磁 控 的 总 数 。 根 据 方 ， 

程 〈6.24)， 得 : 
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EIC.j= 2 Ekc] 


一 关 二 
开 
因为 过 巴 ， 喜 ELIC ] < 1。 
设计 全 域 杂 凑 函 数 的 难 易 程 度 如 何 ? 可 以 说 是 相当 容易 的 ， 只 要 用 到 一 点 数论 知识 束 可 
说 明 这 一 点 。 我 们 选择 杂 瘘 表 的 大 小 人 a 为 质数 〈 正 如 在 除法 杂凑 中 一 样 )。 对 每 一 个 关键 
字 ， 将 其 分 解 成 fr+1 个 字 节 ， 即 x= (xzo，x，…， xi 对 这 种 分 解 的 上 唯一 要 求 是 任 一 字 节 


的 最 大 值 必 须 小 于 mm。 设 a= < 十 ，ai，…，a> 表示 由 从 集合 10，1，…，m- 志 中 随机 选 
出 的 导 1 个 元 球 构 成 的 序列 。 定 祥 相 应 的 杂谈 函数 hf 下: 
h 。(x】 一 之 aiXi mod tm (12.3) 
根据 这 个 定义 又 可 知 
H=UWith} (12.4) 


共有 m“ ”个 成 立 。 
定理 12.4 ”由 等 式 (12.3) 与 〈12.4) 定义 的 类 H 是 个 全 域 杂 次 久 数 类 . 
证 了 明 :; 考虑 任 一 对 不 同 的 关键 字 x，y。 假设 xz 入 yo。 对 ai，a，…，ar 的 任意 固定 
值 ， 恰 有 一 个 an 值 满足 等 式 hH(x) =h(y); 该 ao 值 即 为 下 式 的 解 : 
a (人 (K 一 y) 一 一 癌 2， 一 7) (mod m) 


is 


为 理解 这 个 式 子 ， 注 意 到 mm 是 个 质数 ， 非 零 的 xo- 对 模 m 有 个 雪 法 道 元 素 ， 故 ao 模 
mm 有 了 瞧 一 解 。 ( 见 第 33.4 节 )。 可 见 ， 每 对 关键 字 x 和 y 恰 对 a 的 mn 个 值 发 生 磁 氛 ， 因 为 对 
<al，a，…，a > 的 每 一 可 能 值 它们 都 恰好 磁 提 --- 次 。 闵 因为 序列 a 的 可 能 值 共有 m” 
钟 ， 故 关键 字 x 和 * 发 生 辜 擅 的 概率 为 my mr5=1vimn。' 这 就 证 明了 革 是 全 域 的 。 


12.4 开放 地 址 法 


在 开放 地 址 法 中 , 所 有 的 元 素 都 存放 在 杂 姿 表 里 。 亦 即 , 每 个 表 项 或 包含 动态 集合 的 一 
个 元 素 , 或 包含 NIL。 当 找 查 一 个 元 素 时 , 我 们 要 检查 所 有 的 表 项 , 直到 找到 所 求 的 元 素 , 或 
该 元 素 不 在 表 中 。 不 像 在 拉链 法 中 , 这 儿 没 有 链表 , 也 没有 元 素 存 放 在 杂凑 表 外 。 在 这 种 方 
法 中 , 杂 凄 表 可 能 会 被 填 满 以 致 于 不 能 插 人 任何 新 的 元 素 , 但 装载 因子 k 是 绝 不 会 超过 : 
1 

当然 ， 在 拉链 法 让 我 们 也 可 将 链表 存放 在 杂凑 表 中 未 用 的 构 中 【 郧 练 习 12.2--5)， 但 开 
放 地 址 法 的 好 处 就 在 于 它 根 本 不 用 指针 ， 而 是 计算 出 要 存 取 的 各 个 槽 。 这 样 一 来 ， 由 于 不 用 
存储 指针 而 节省 了 空间 ， 也 可 减少 磁 擅 ， 提 高 查找 速度 。 

在 开放 地 址 法 中 ， 当 要 揪 人 一 个 元 素 时 ， 我 们 可 以 连续 地 检查 (或 称 探查 ) 杂凑 表 的 各 
项 ， 直 到 找到 一 个 空 槽 来 放置 待 揪 人 的 关键 字 。 检 查 的 顺序 不 一 定 是 0，1，…，m-1 (这 
种 顺序 下 查找 时 间 为 @tn))， 而 是 要 依 束 于 待 插 人 的 关键 字 。 为 确定 要 探查 哪些 槽 ， 我 们 将 
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杂凑 函数 加 以 扩充 ， 使 之 包含 探查 号 以 作为 其 第 一 个 输 人 人 参数。 这样， 杂凑 函数 就 变 为 
D: U x 刘 ，1，…，Im 一 上 一 10，1，…，m 一 二 
对 开放 地 址 法 来 说 ， 要 求 对 每 一 个 关键 字 k， 探 查 序 列 
<hfk，0}，htk，137，-…，R(K，Bn--t > 
必须 是 <0，1，…，m-1> 的 一 个 排列 ， 使 得 当 霖 次 表 逐 新 填 满 时 ， 每 一 个 表 位 最 终 都 可 被 
视 为 用 来 牢 人 新 关键 字 的 构 。 在 下 面 的 人 协和 代码 中 ， 我 们 假设 杂凑 表 工 中 的 元 素 为 无 卫 是 数 
据 的 关键 字 。 每 个 槽 或 色 含 一 个 关键 字 ， 或 包 售 NIL， 
HASH-JNSERTIT.k) 
TI is<-0 
2 TeEPeat 二 -hik,i 
3 ifTH=NIL 
| thehn 丁 [长 
5 Tetutro j 
看 else i*+-i 十 1 
了 untii = m 
8 erTrOT "hash table overflow” 
查找 关键 字 k 的 算法 的 探查 序列 与 将 搬 人 的 镍 人 算法 是 -- 样 的 。 当 在 查找 过 程 中 科 
.- 一 个 室 模 中、 查找 算法 就 非 成 功 地 停止， 因为 如 果 下 确实 在 表 中 的 话 也 度 该 在 该 处 ， 而 不 
是 探查 序列 的 稍 后 位 置 上 (之 所 以 这 样 说 是 耳 为 我 们 假定 了 关键 字 不 会 被 删除 )。 过 程 
HASH-SEARCH 的 输入 为 一 全 次 表 T 和 -一 关键 字 k， 如 果 模 j 中 包含 关键 字 则 返回 j; 
如 果 卡 不 在 表 下 中 则 返回 NIL. 
HASH-SEARCHCTR) 
1 ie 
TePeat ji 发 人 ki 
ifT[j]=K 
then return j 


了 

了 

十 

5 ji- 十 1 
6 _ untilT[ij= NIL ori= mm 

了 Teturnm MTIL 

在 开放 地 址 法 中 ， 对 杂凑 表 元 寄 的 删除 操作 执行 起 来 比较 困难 。 当 我 们 从 槽 i 中 删除 关 
键 字 时 ， 不 能 仅 将 NIL 置 于 其 中 来 标识 它 为 窑 。 如 果 这 样 做 的 话 就 会 有 个 问题 ， 在 揪 人 某 
关键 字 k 的 探查 过 程 中 发 现 i 被 占 朋 了 ， 刚 上 就 被 搬 到 后 面 的 位 置 上 ， 在 将 槽 i 中 的 关键 字 
删除 后 ， 识 无 法 检索 关键 字 k 了 。 有 -个 解决 办 法 ， 就 是 在 槽 ii 中 辕 特 定 的 值 
DELETED， 而 不 用 NIL。 这 样 就 要 对 过 程 HASH-SEARCH 作 相 应 的 和 修改， 使 之 在 看 到 
DELETED 时 能 继续 搜索 下 去 。 对 HASH-INSERT 过 程 来 说 ， 有 DELETED 标识 的 槽 就 
相当 于 ~- 个 空 槽 ， 仍 然 可 以 搬入 新 元 素 。 但 如 果 这 样 做 的 话 ， 查找 时 间 训 不 再 依赖 于 装置 因 
子 g 了 。 就 因为 这 个 原因 ， 在 某 些 元 素 必 须 被 删除 的 应 用 中 ， 客 用 拉链 法 来 解决 磁 撞 。 

在 我 们 的 分 析 中 ， 逢 一 个 一 致 厅 凑 的 假设 : 即 假 设 每 个 关键 字 的 探查 序列 是 10，1， 
…，m 一 1] 的 in 种 排列 中 的 任 一 种 的 可 能 性 是 相同 的 。 一 致 杀 凑 将 表面 定义 过 的 简单 一 般 
杂 由 的 概念 加 以 一 般 化 ， 推 广 到 杂凑 函数 的 结果 不 只 是 -- 个 数 ， 而 是 一 个 完整 的 探查 序列 的 
情形 。 完 全 的 一 致 杂 丐 是 很 难 实现 的 ， 在 实际 中 常常 采用 它 的 一 些 近 似 方法 (如 下 面 要 定义 
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的 双重 杂 赎 等 )。 

有 三 种 技术 可 用 来 计算 开放 地 址 法 中 的 探查 序列 : 线性 探查 ， 二 次 探查 ， 以 及 双重 探 
查 。 这 上 几 种 技术 都 能 保证 对 每 个 关键 字 k，<hf(k,.iD,htk.2)…,htkm)> 都 是 <01…:m1> 
的 一 个 排列 。 但 是 ， 这 些 技术 都 不 能 实现 一 致 杂凑 的 假设 ， 因 为 它们 能 产生 的 不 同 探查 序列 
数 都 不 超过 和 个 (一 致 杂 站 要 求 有 mm! 个 探查 序列 )。 这 三 种 技术 中 ， 双重 杂 姿 能 产生 的 近 
查 序 列 数 最 多 ， 因 而 能 给 出 比较 好 的 结果 . 


线性 探查 


给 定 一 个 普通 的 杂 次 函数 h: U- 吕 ,1 …:a 一 车 线性 探查 方法 采用 的 杂凑 函数 为 : 
h(k 站 = (tk mod mi 一 小 1] mm 一 

给 定 一 个 关键 字 *， 第 一 个 探查 的 槽 是 T[h'ft)], 其 次 是 槽 Tthfk+l],…, 直 到 槽 TIm-J]， 然 
后 又 卷 绕 到 槽 TIOLTfI]…， 直 到 最 后 探查 档 TIh'k)-1。 在 线性 探查 方法 中 ， 初 始 探查 位 置 
确定 了 整个 序列 ， 故 共有 m 种 不 同 的 探查 序列 。 

这 种 方法 比较 容易 实现 ， 但 它 存在 着 一 个 问题 ， 称 作 群 集 。 随 着 时 间 的 推移 ， 连 续 被 占 . 
用 的 槽 不 断 增 加 ， 平 均 查找 时 间 也 随 着 不 断 增 加 。 例 如 ，. 如 果 表 中 有 n= 王 / 2 个 关键 子 ,， 
其 中 俩 数 下 标的 楼 都 被 占用 ， 硒 数 下 标的 槽 都 是 空 的 ， 则 平均 每 次 不 成 功 的 查找 要 探查 1.5 
个 柱 ，、 但 如 果 头 an=imy2 个 位 置 是 被 占用 的 ， 则 平均 探查 次 数 就 增 硬 n7/ 4=m /8 次 。 实 
集 现 象 很 容易 出 现 ， 因 为 如 果 在 一 个 空 槽 前 有 i 个 满 的 槽 ， 则 该 空 档 为 下 一 个 将 被 占用 的 模 
的 概率 是 (i+1)“ m; 而 如 果 该 档 的 前 一 个 也 是 空 的 ， 周 概 率 变 为 17 m。 这 样 ， 连 续 的 被 占 
用 槽 序列 将 会 变 得 越 来 越 长 ， 因 而 对 一 致 杂凑 法 来 说 不 是 一 个 很 好 的 近似 . 


二 次 探查 


二 次 探查 采用 如 下 形式 的 杂 竣 函数 : 

h 作 坷 = (hkyHe iteiimod mm 12. 
其 中 和 为 辅助 杂 琴 函数 ,cl 和 ec 基 0 为 辅助 常数 ，i= 沿 1…,m-l。 初 始 探查 的 位 置 是 
Tthktol， 后 续 探 查 位 置 在 此 基础 上 再 加 上 二 次 地 依赖 于 探查 数 i 的 偏 移 重 ， 这 个 方法 要 比 
线性 探查 好 ， 但 为 了 充分 利用 杂 姿 表 ， 值 ccz 和 mm 的 选择 有 所 限制 。 问题 12-4 给 出 了 选 
择 这 些 人 参数 的 一 种 方法 。 还 有 ， 如 果 两 个 关键 字 的 初始 探查 位 署 相同 ， 则 它们 的 探查 序列 也 
相同 ， 因 为 htk,,0)= hk 阁 含 着 hk 二 hfk2iD。 这 使 得 群集 现象 有 所 减少 。 像 在 线性 探 
查 中 一 样 ， 初 始 的 探查 位 置 决定 整个 的 探查 序列 ， 故 只 有 mm 个 不 同 的 探查 序列 有 用 。 


双重 杂 惠 


双重 杂 政 是 用 于 开放 地 址 法 的 最 好 方法 之 一 ， 因 为 它 所 产生 的 排列 具有 随机 选择 的 排列 
的 许多 特性 。 它 采用 如 下 的 杂 玉 函数 : 
h(ki= (hi(kjHih2(kj mod m 

其 中 h 和 h; 为 辅助 杂 次 函数。 初始 探查 位 置 为 TfhiGcj， 后 续 的 探查 位 置 在 此 基础 上 加 上 

偏 移 量 hy(k) 模 im。 与 线性 探查 或 二 次 探查 所 不 同 的 是 ， 这 里 的 探查 序列 以 两 种 方式 依赖 于 

关键 字 x， 因 为 初始 探查 位 置 、 偏 移 量 都 可 能 发 生变 化 。 图 12.5 给 出 了 一 个 用 双重 杂 姿 法 

进行 撞 人 的 例子 。 这 里 我 们 有 一 个 大 小 为 1 的 条 丐 表 ， 其 中 四 (k) =Kmod 13，h (kx) 
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=1+ (kmod 11)。 因 为 41mod 13， 且 14=3 mod 11， 故 关键 字 14 将 被 搬入 空位 9 
-在 这 之 前 要 检查 空位 1 和 空位 $S、 并 发 现 它 们 已 被 占用 。 





图 12.5 双重 杂 幅 法王 的 捅 人 


为 能 查找 整个 杂 瑟 展 , 值 hx( 约 要 与 表 的 大 小 血 互 质 。 否 则 , 如 果 对 关键 字 km 与 hb) 
有 最 大 公约 数 d> 1 则 查找 就 仅 能 检查 到 杂凑 表 的 1 7 d( 见 第 三 十 三 章 )。 确 保 这 个 条 件 成 
立 的 一 个 方便 的 办 法 是 取 问 为 2 的 宕 , 并 设计 一 个 总 产生 奇数 的 ip。 另 一 个 方法 是 取 mm 为 
质数 , 并 设计 一 个 总 是 产生 较 mm 小 的 正 整 数 的 h:。 例 如 , 我 们 可 以 取 m 为 质数 , 并 取 
hgo=ximodm 
hoO=1+k mod m7) 
其 中 mm/ 略 小 于 mm( 例 如 m-1l 或 mm- 念 。 看 几 个 例子 ， 如 果 上 = 123456， m 一 701， 则 有 
hi 名 ==80，bhazo0 一 257、 可 知 第 一 个 探查 位 置 为 80， 然 后 检查 每 第 257 个 槽 ( 模 mm， 直 到 找 
到 该 关键 字 ， 或 查 壳 了 所 有 的 档 。 
双重 杂 站 法 中 用 了 B(m3 种 探查 序列 ， 而 线性 探查 或 二 次 探查 中 用 了 @(m) 种 ， 故 前 者 
是 对 后 两 种 的 一 种 改进 ， 这 种 改进 的 原因 在 于 ， 每 一 对 可 能 的 (htioshuto) 都 产生 一 个 不 同 
的 探查 序列 ， 且 当 关键 字 变化 时 ， 初 始 探查 位 置 hx) 与 偏 移 晶 hz0k) 都 可 能 独立 地 变化 . 双 
重 杂 凌 的 性 能 与 “理想 的 "一 致 杂 淡 的 性 能 看 起 来 就 很 接近 了 。 
二 


对 开放 地 址 杂 姜 的 分 析 


像 在 分 析 拉 链 法 时 一 样 ， 对 开放 地 址 法 的 分 析 是 以 杂 姿 表 的 装载 因子 w 来 表达 的 。 我 们 
已 经 知道 ， 如 果 n 个 元 素 存 储 于 有 m 个 槽 的 表 中 ， 则 每 个 档 中 的 平均 元 素数 为 wx= ny m。 
当然 ， 在 开放 地 址 法 中 每 个 槽 中 至 多 只 能 有 -个 元 素 ， 因 而 n 和 mm， 这 意味 着 x 和 1， 

现 假设 我 们 采用 前 是 一 致 杂 次 . 在 这 种 理想 的 方法 中 ， 每 个 关键 字 k 的 探查 序列 
CDM0eD she D> 为 <0 am > 的 任 一 各 排列 的 可 名作 是 相同 的 。 也 就 是 

， 每 一 种 可 能 的 探查 序列 等 可 能 地 被 用 于 插 人 或 查找 。 当 然 ， 每 一 个 给 定 的 关键 字 有 了 唯一 
困 写 的 拓 查 序列 我 们 这 里 想 说 的 是 ， 考 虑 到 关键 字 空 间 上 的 概率 分 布 及 施 于 这 些 关 键 字 的 
( 杂 姿 表 的 ) 操 作 ， 每 一 种 探查 序列 是 等 可 能 的 。 
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我 们 下 面 来 分 析 在 一 至 杂 下 假 设 下 用 开放 地 址 法 进行 染 凑 时 预期 的 探查 数 。 上 先 来 分 析 一 
次 不 成 功 碍 找 中 的 探查 数 . 

定理 12.s$ 给 定 一 个 装载 因子 为 w=ayvmn<l 的 开放 地 址 杂凑 天 ， 一 次 不 成 切 查 找 中 的 
探查 数 和 全 多 为 17 (1- 扫 。 假 设 杂 次 是 一 致 的 

证 明 : 在 一 次 不 成 功 的 查找 中 ， 除 了 最 后 一 次 之 外 的 每 一 次 拧 查 郡 要 检查 一 个 被 占用 
的 、 但 并 不 包含 所 求 关 键 字 的 构 ， 最 后 检查 的 畏 是 空 的 。 

现 定 义 
Pi 一 Pr{ 恰 有 i 次 探查 访问 被 占用 构 } 
其 中 i=12…。 对 i>n， 有 Pi=0， 因 为 至 多 只 有 个 槽 被 占用 。 这 样 ， 期 望 的 探查 数 为 

1 + > 让 ， [12.6) 


为 求 上 式 ， 我 们 定义 
q 一 Pr 至 少 有 ;次 探查 访问 被 占用 档 }，i = 0.1.2… 


然后 度 用 等 式 (6.28): 
了 工 ip， 一 之 qi 
对 i> 1，q, 的 值 是 什么 呢 ? 第 一 次 探查 访问 一 个 被 占用 槽 的 概率 为 ny m; 这 样 
己 ; 一 疝 


因为 杂 趴 是 一 致 的 ， 故 第 二 次 探查 ( 如 果 有 必要 进行 的 话 ) 访 曾 余 下 的 未 探查 的 mm 一 1 
个 精 中 的 一 个 ， 其 中 有 nm 一 1 个 是 未 被 占用 的 。 又 仅 当 第 一 次 探查 访问 的 是 -- 个 被 占用 档 时 
才 做 第 二 次 探查 ， 故 有 : 
人 人) 
一 般 地 ， 仅 当前 i -1 次 探查 都 访问 了 被 占用 构 时 才 做 第 i 次 探 柱 ， 且 被 探查 的 槽 为 余 
下 的 mi; + 工 个 《其 中 m 一 1+ 1 个 被 占用 ) 中 之 一 的 可 能 性 相同 ， 国 所 


fnYra 一 1 于 一 上 十] 卫 _ i 
= 人 ) 作 22)(2T)< (人 
i = 1.2…n, 因为 如 果 委 和 且 j > 0 六 Am 一 站 和 nxzmn， 在 nm 次 探查 后 ， 所 有 hn 个 蕊 
占用 楷 都 被 访问 过 了 ， 以 后 不 会 再 被 访问 ， 故 对 ji> nxq; = 0， 


现在 可 以 来 求 (12.6) 了 。 给 定 假设 x < 1，-- 次 不 成 功 查找 中 的 平均 探查 数 为 : 


1+Yip =-1+Yaq 








委 1 十 K 十 g 十 攻 十 … (12.7) 
_ 1 
] 一 站 
等 式 (12.7) 具 有 一 种 直观 解释 : 一 次 探查 是 必定 要 做 的 ， 要 做 第 二 次 的 概率 约 为 wx， 要 
做 第 三 次 的 概率 约 为 汪 ， 等 等 。 
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如 果 a 是 个 常数 ， 由 定理 12.5 可 知 -次 不 成 功 查找 的 运行 时 间 为 QHD。 例 如 ， 如 果 所 
给 杂 姿 表 是 半 满 的 ， 则 一 次 不 成 功 的 查找 中 的 平均 探查 次 数 为 17(1-0.3=2。 如 果 杂 次 表 
是 90% 药 满 ， 则 平 均 探 查 次 数 为 17(1-0.9= 10， 

同样 可 由 定理 12.5 得 知 过 程 HASH-INSERT 的 性 能 ， 

推论 12.6 平均 情况 证， 疝 -- 个 装载 因子 为 x 的 开放 地 址 杂凑 表 中 插 人 一 个 元 束 至 多 
要 做 17(f1-o) 次 探查 ， 假 设 杂 丫 是 一 致 的 。 

证 明 : 只 有 当 表 中 有 空 槽 时 才 可 捅 人 新 元 过 , 族 we<1。 揪 人 一 个 关键 字 要 先 做 一 次 不 威 
动 的 查找 ,然后 将 该 关键 字 置 人 第 一 个 被 磁 到 的 空 档 中 。 所 以 ,期 望 的 探查 数 为 1 /1 一 o。 

下 面 给 测 一 次 成 功 的 查找 中 的 探查 次 数 。 

定理 12.7 给 定 一 个 装载 因子 为 wx<1 的 开放 地 址 茶 趴 天 ， 一 钦 成 功 查 找 中 的 期 望 探 查 





假定 杂凑 是 一 副 的 ， 且 表 中 的 每 个 关键 字 被 吝 找 的 可 能 性 是 相同 的 。 

证 明 : 查找 关键 字 k 的 探查 序列 与 播 人 关键 字 为 k 的 元 素 的 探查 序列 是 相同 的 。 根 据 
推论 12.6， 如 果 k 是 第 (i+D 个 插 到 表 中 的 关键 字 ， 则 在 对 的 一 次 查找 中 期 望 的 探查 次 数 
友 多 是 17(i-iy mo=myv (m 一 )》， 对 杂凑 表 中 所 有 mn 个 关键 字 求 平均 ， 则 得 一 次 成 功 的 查找 


中 平均 的 探查 次 煞 为 : 
[Im mg li 
工 之 南 一 | 本 守 而 1 
- 工 (H - 


其 中 H = 愤 _,17j 是 第 ;级 调和 数 ( 如 在 等 式 (3.5) 中 定义 的 一 样 )， 根 据 (3.11) 和 (3.12) 
中 给 岂 的 界 mi 和 HBi<tini+1， 得 


(HL 也 。) <ztmm 一 tm mn) 








此 即 -- 次 成 功 的 查找 中 预期 的 探查 数 的 一 个 界 。 
妇 些 所 给 杂凑 表 是 半 满 的 ， 则 期 望 的 探查 数 小 于 3.387。 如 果 杂 凑 表 9% 满 ， 则 期 望 的 
探查 数 小 于 3.670。 


思考 是 


12-1 最 长 探 柱 的 界 
有 一 个 大 小 为 mm 的 杂凑 表 被 用 来 存放 个 元 素 ，n 和 my 2， 并 采用 开放 地 址 法 来 解雇 


一 161 一 


碰撞 
a, 假 设 杂 凌 是 一 致 的 ， 证 明 对 i= 1.2,…:n, 第 i 次 插 人 需要 多 于 次 探查 的 概率 至 多 为 ， 
2 。 

B. 证 明 : 对 ji= 12,…m, 第 i 次 插 人 需要 多 于 21gn 次 探查 的 概率 至 多 是 17 位 。 

设 随 机 变量 汪 表示 第 i 次 插入 所 需 的 探查 数 。 在 上 面 (b) 中 已 证 明 Pr{Xi>21eoj 芭 

nm。 设 随机 变量 和 =imaxi eicnX 表示 mn 次 播 人 中 所 带 探查 数 的 最 大 值 . 
5 证明: PrfX>218 相 所 17n。 
d. 证 明 : 最 长 探查 序列 的 期 望 长 度 为 Ex=O(lgn). 


12-2 查 投 静态 集合 


盘 设 要 求实 现 一 个 含 m 个 元 素 的 动态 集合 ， 各 元 素 的 关键 字 为 数字 。 该 集合 是 静态 的 ( 
无 INSERT 或 DELETE 操作 )， 队 一 带 要 的 操作 是 SEARCH。 可 以 用 任意 长 的 时 间 来 对 n 
个 元 素 进行 预 处 理 ， 以 便 SEARCH 操作 可 以 有 较 快 的 运行 速度 . . 

a. 证 明 : 除 了 存储 集合 元 素 所 需 的 空间 外 ， 在 最 坏 情 况 下 无 需 妨 外 的 空间 就 可 在 DQUg 中 时 
间 内 实现 SEARCH。 

b. 考 虑 用 开放 地 址 法 对 杂谈 表 的 症 个 槽 进行 杂凑 来 实现 上 面 的 集合 .假设 杂 并 是 一 致 
的 。 对 这 种 实现 中 的 一 次 不 成 芝 的 查找 来 说 ， 要 使 其 平均 性 态 至 少 和 (a) 中 的 一 样 好 ， 额 外 
所 需 的 ma 空间 的 最 小 值 是 和 多少 ? . 


12-3， 拉 链 法 中 栓 的 大 小 


盆 设 我 们 有 一 个 含 n 个 槽 的 杂凑 表 ， 并 用 拉链 法 来 解决 磁 拉 。 另 恨 设 向 表 中 揪 人 mn 个 
关键 字 ， 每 个 关键 字 被 等 可 能 杂凑 到 每 个 槽 。 设 在 所 有 关键 字 被 揪 人 后 ，m 是 各 槽 中 所 合 
关键 字数 的 最 大 值 。 证 明 BEIM] 的 一 个 上 界 为 Diny 井 1g 吕 。 

a. 论 证 下 个 关键 字 被 杂凑 到 某 一 特定 梢 中 的 概 率 为 

1 " 
Qu -5 (U 

b. 设 P, 为 M=k 的 概率 ， 也 就 是 包含 最 多 关键 字 的 术 中 包 会 k 个 关键 字 的 概率 。 证 
明 : 了 snQu。 

c. 应 用 Stirling 近似 公式 (2.10 来 证 明 Que<ek7 KK 

4. 证 明 : 存在 常数 c> 1， 使 得 Q，< /Za 对 ko = clgn /lglgn 成 立 ， 并 总 结 : P， 


<17/n 对 k ,= cigny/1lglgn 成 立 。 








e- 论 证 : 
Cign clgn | .clgn 
EIMl< Pr| M > 记 下 人 an 十 Pr| M < 总 到 in 
并 总 结 : EIM] = OUgn “lglgn)。 
12-4 二 次 探查 


假设 要 在 一 个 杂凑 表 ( 长 度 为 四 ) 中 查找 关键 字 k， 并 假设 有 一 杂凑 函数 将 关键 字 空间 
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册 射 到 集合 {0,1,…,m-1} 上 。 查找 方法 如 下 : 

1 .计算 值 ie-h(k)， 置 j=-0- 

2. 探 查 位 置 1， 若 找到 所 需 关键 字 ， 或 这 个 位 置 是 空 的 ， 则 结束 查找 。 

3. 置 j<(+lmod mji< 0G+jh modm， 返 同步 (2)。 

设 生 是 2 的 帮 

a. 通 过 给 出 等 式 (12.5) 中 cl 和 c2 的 适当 值 来 证 明 这 个 方案 是 更 一 般 的 “一 次 榨 查 ”的 一 
个 实例 。 

b. 证 明 : 在 最 坏 情 况 下 ， 这 个 算法 要 检查 表 中 每 一 个 位 置 。 


12-5 一 人 全域 杂 湾 


设 互 = fb} 为 一 杂凑 函数 类 ， 其 中 每 个 h 将 关键 字 域 U 映射 到 10.1,…,m 一 1 上 , 称 辽 是 
k 一 全 域 的 。 如 果 对 每 个 由 不 不 同 的 关键 字 < xx 加 > 构 成 的 固定 序列 以 及 从 瑞 中 随机 
选 出 的 kx， 序 列 <hfx jh hxJj> 是 囊 个 长 度 为 大 的 序列 (其 元 素 取 自 10,1…m 一 直 ) 中 
任 一 个 的 可 能 性 相同 . 

a ,证明 :; 如 果 责 是 2 一 全 域 的 ， 则 它 是 全 域 的 。 

b. 证 明 : 第 12.3.3 节 定 义 的 了 不 是 2-- 全 域 的 . 

c. 证 明 : 如 果 对 12.3.3 节 中 孔 的 定义 加 以 收 改 ， 使 得 函数 还 包含 一 个 常数 项 b， 亦 即 ， 
如 果 把 h(x) 替 换 成 

h (mg=a - x+Hb 

则 H 是 2 一 全 域 的 ， 


练习 十 二 


12.1-1 考虑 由 一 个 长 度 为 惠 的 直接 寻 址 表 工 表示 的 动态 集合 S。 给 出 一 个 查找 $ 的 最 大 元 素 的 算 
法 。 所 给 出 的 过 程 在 最 坏 情况 下 运行 时 间 怎 样 ? 

12.1-2 ”一 个 位 向 量 即 一 个 仅 包含 0 和 ]1 的 数组 。 长 度 为 严 的 位 向 量 所 占 空 间 要 比 包 含 征 个 指针 的 赦 
组 少 得 和 多。 请 说 明 如 何 用 一 个 位 向 量 来 表示 一 个 包 售 不 同 元 素 《和 无 卫 星 数据 ) 的 动态 集合 。 字典 操作 的 运 
行 时 间 庶 该 是 DT)， 

12.1-3 ”说明 如 何 实 静 一 个 直接 寻 址 表 ， 使 各 元 素 的 关键 字 不 必 都 不 相同 ， 且 各 元 素 订 有 卫星 数据 . 
所 有 三 种 字典 操作 【INSERT，DPBELETE 利 SEARCH] 的 时 间 应 为 CQK1). 

12.1~4 * ”我 们 希 万 用 在 一 个 非常 大 的 数组 上 的 直接 寻 址 来 实现 字典 ， 开 始 时 ， 该 数组 中 可 能 包含 废 
料 ， 得 要 对 作 初 始 化 又 不 太 实 际 ， 拓 为 该 数组 的 规模 太 大 了 .请 给 出 在 大 规模 数组 上 实现 直接 寻 址 字典 的 
方案 ， 每 个 存储 的 对 铺 占 用 DI1) 空间 ， 操 作 SEARCHS、 INSERT 和 DELETE 的 时 间 为 D(UD); 对 数据 结 
榴 韦 区 化 的 也 间 为 OUD。 


12.2-1 假设 我 们 用 一 随机 的 杂凑 函数 来 将 n 个 不 同 的 关键 字 杂 次 到 一 个 长 度 为 血 的 数组 中 ， 问 预 
期 的 磁 撞 数 是 和 多少? 更 准确 地 说 ， 符 合 { (x， 及 : hx) =hy) ) 的 基数 预期 是 多 少 ? 

12.2-2 说 明 将 关键 字 5，28，19，15，20，33，12，17，10 插 人 到 一 个 用 拉链 法 来 解决 姓 搜 的 杂 凌 
表 中 的 过 程 ， 设 该 表 有 9 个 梢 ， 杂 次 冰 数 为 htk) =k*med 9。 


12.2-3 论证 对 一 个 表 来 说 ， 无 论 新 元 素 撒 在 表 头 还 是 插 在 表 尾 ， 一 次 上 成功 的 查找 的 时 间 都 是 一 梓 “ 
的 。 
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12.2-4 有 人 人 认为， 如果 能 对 拉链 方案 路 作 改 动 ， 司 每 个 链表 都 保持 排序 状态 ， 则 性 能 可 有 很 大 提 
高 。 这 种 修改 对 成 功 查 找 、 失 败 查 我 、 插 人 和 盟 徐 井 作 的 运行 时 间 有 何 影 响 ? 

12.2--5 ”如果 撕 所 有 来 用 的 槽 都 链 成 一 个 链表 ， 在 杂凑 表 中 应 如 何 分 虑 和 去 配 元 素 的 空间 ? 释 设 一 个 
档 中 可 奔放 一 个 标识 以 及 一 个 元 素 和 -- 仿 指针， 或 一 个 标识 及 两 个 指针 。 所 有 的 字典 及 空闲 表 的 时 间 都 庶 
为 DT)。 是 否 希 贤 对 空闲 表 进 行 双向 链接 ? 单 向 链接 够 不 够 ? 

12.2-6 衣 :如果 |IUI> mm。 则 有 一 大 小 为 习 的 避 的 子 尘 ， 其 中 含有 亲 趴 到 同一 - 模 中 的 洋 键 字 ， 司 
得 对 带 拉链 的 杂 次 表 的 最 趟 情 襄 运 行 时 间 为 @(n)。 


12.3-1 假设 我 们 要 诅 找 一 个 长 度 为 nm 的 链 硼 ， 其 中 每 个 元 素 包含 一 个 关键 字 k 和 一 个 条 次 值 htk). 
舒 个 关键 字 者 是 长 字符 串 。 在 表 中 真 找 具 有 给 冠 关键 字 的 元 宗 时 ， 旭 何 利用 各 元 烤 中 的 杂 计 傅 ? 

123-2 假设 -- 个 长 度 为 的 字符 昌 被 杂凑 到 mm 个 槽 中 ， 方 法 是 将 其 视 为 一 个 以 128 为 其 的 数 ， 然 后 
应 用 内 法 方法 。 很 容易 把 数 m 表示 为 一 个 32 位 的 机 区 字 。 但 对 长 度 为 fr 的 字符 囊 ， 因 被 视 为 以 138 为 基 的 
数 来 处 理 ， 就 要 占用 若干 的 机 器 字 。 假设 应 用 除法 来 计算 一 一 个 字符 理 欧 杂 典 俏 ， 如 和 何 才能 除了 该 日本 身 的 
占用 的 空间 外 ， 只 利用 和 常数 个 的 机 器 字 ? 

12.3-3 考虑 除法 方法 的 另 一 种 版 本 ， 其 中 ho 一 kmoedm，m 一 好 -1，k 为 按 上 三 数 全 艇 释 的 字 特 
串 . 证 明和 如果 串 革 可 让 串 y 通 过 其 自身 的 置换 排列 导出 ， 则 x 和 了 有 具有 相同 的 杂 读 什 。 给 出 一 个 有 关 这 个 
特性 的 例 冯 。 

12.3-4 考虑 一 个 杂 趴 表 。 其 大 小 为 四 = 1000， 杂 站 画 数 为 hk) = LimtkA mod 1D4，A= (V5 
-站 “2。 请 计算 关键 字 61，62， 的 ， 妈 被 杂 痰 后 的 位 置 ， 

12.3--5 证 明 : 在 等 式 【12.3) 中 ，、 如 果 限 制 a 的 每 个 成 分 ai 为 非 海 ， 则 集合 Hfh,} (如 【12.4) 中 所 
定义 的 ) 就 示 是 全 域 的 〈 提 未 : 考虑 关键 字 X= 0 和 7 一人 


12.4-1 考虑 将 关键 字 10.22.31.4,15.28.17,88,59 用 开放 地 址 法 播 人 到 一 个 长 庶 为 到 = 日 的 杂凑 表 中 ， 
主 杂 凌 卫 数 为 ht)=k mod m， 说 明 用 线性 探查 ， 二 次 探查 人 = Je 三 习 以 度 双重 杂 瓷 h:=THK mod 
(m 一 入 将 这 些 关键 字 搬 人 杂 洲 表 的 结果 ， 

12.4-2 请 写 出 HASH-DELETE 的 以 代 码 ; 修改 HASH-INSERT 和 HASH-SEARCH， 使 之 能 处 
理 值 DELSETEDD， 

13.4-3 ” 盆 设 我 们 采用 双重 杂 次 来 解决 磁 撞 ， 杂 癌 国 数 为 hki= (hif(kyHhakh mod mm。 证 明 : 探查 序 
列 < 人 (HK fg)> 是 槽 的 序列 <01…,m-]> 的 -- 个 排列 , 当 由 促 当 hafg) 与 科 互 质 . (提示 : 抠 
第 三 十 三 章 ) 

12.4-4 考虑 具有 一 致 杂 丐 特性 的 、 装 埠 因 子 为 g&=172 的 一 个 开交 地 址 宗 凑 表 。 在 一 侈 不 成 功 查找 
中 ， 期 望 的 控 查 次 数 是 多 少 ? 在 一 次 成 功 的 查找 中 呢 ? 对 装载 因子 为 374 和 各 778 的 淋 凑 表 分 别 重复 这 些 
计算 。 

12.4-5 * 假设 我 们 用 开放 地 址 法 和 一 致 素 凑 来 将 n 个 关键 字 插 人 一 个 大 小 为 中 的 杂凑 表 中 。 设 
pm) 为 没有 磁 盖 发生 的 概率 。 证 明 : ptom)senao 07 2。 (提示 : 兄 等 式 (2.7) 论 证 当 m 超过 Vm 时 ， 避 
贫 确 擅 的 概率 迅速 趋 于 零 。) 

12.4-6 * ”调和 级 数 的 界 可 以 被 进一步 改进 为 : 


E 
一 一 12.8 
囊 , 一 Inn 十 ?十 (12.8) 


其 中 ?= 六 5772156649… 被 称 为 欧 拉 常数 ，《 满足 0<E <1。 调 和 级 数 的 这 个 改进 的 近似 对 定理 12.7 有 何 
影 啊 ? 

12.4-7 * ” 考 吸 一 个 装载 因子 为 的 开放 地 址 杂 姜 表 。 要 使 一 次 不 成 功 查找 中 的 期 望 探查 歼 为 成 功 查 
找 中 的 两 倍 ，z* 应 是 和 多大? 可 认为 成 功 查找 中 的 探查 数 为 (1 7 oln(l (1 一 oj。 


第 十 三 章 .二 又 查找 树 


查找 树 支 持 很 多 动态 集 人 台 操 作 ， 如 SEARCH，、，MINIMUM、MAXIMUM、PRE- 
DECESSOR、SUCCESSOR、INSERT 以 及 DELETE 等 等 。 它 既 可 用 作 一 个 字典 ， 也 可 
用 作 一 个 优先 级 队列 。 

作用 于 二 叉 查 找 树 上 的 基本 操作 的 时 间 与 树 的 高 度 成 正比 。 对 一 棵 含 n 个 节点 的 完全 
二 及 树 ， 这 些 操 作 的 最 坏 情 况 运行 时 间 为 @(lg 四 。 但 如 果树 是 含 na 个 节点 的 线性 链 ， 则 这 
些 操作 的 最 坏 情 况 运 行 时 间 为 Btn)。 在 13.4 节 中 我 们 将 看 到 ， 一 村 随 机 构造 的 二 叉 树 的 商 
度 为 DUig am， 从 而 基本 的 动态 集合 操作 的 时 间 为 @( lg 中)。 

在 实际 中 ， 我 们 并 不 总 能 保证 二 叉 查 找 树 是 随机 构造 成 的 ， 但 有 些 一 叉 查 找 树 的 变形 上 
的 基本 操作 其 最 坏 情 况 性 能 却 是 很 好 的 。 第 十 四 章 给 出 了 这 样 一 种 变形 ， 即 红 - 黑 树 ， 其 帘 
度 为 O(lgn)。 第 士 九 章 要 介绍 B- 树 ， 这 种 结构 对 维护 数 揣 库 特别 有 效 ， 

在 介绍 过 二 叉 查 找 树 的 基本 性 质 之 后 ， 下 面 的 章节 讨论 如 何 遍 历 二 叉 查 找 树 ， 如 何在 树 
中 查找 一 个 值 ， 如 何在 树 中 找 最 大 元 素 和 最 小 元 素 ， 如 何 找 岂 某 一 元 素 的 前 趋 和 后 继 ， 以 及 
如 何 对 二 又 查找 公 进 行 插 人 或 删除 ， 等 等 。 树 的 一 些 基 本 数学 性 质 我 们 已 在 第 五 章 中 介绍 过 
了 。 


13.1 二 叉 查 找 树 


如 图 13.1 所 示 ， 一 标 二 叉 查 找 树 是 按 工 多 树 结构 来 组 织 的 。 这 样 的 树 可 用 链接 数据 绪 
构 来 表示 ， 其 中 的 每 个 节点 都 是 一 个 对 象 。 节 点 中 除了 key 域外 ， 还 包含 城 left，right 和 
p， 它 们 分 轴 指 向 该 节点 的 左 儿 子 、 右 儿子 和 父 节 点 。 如 果 某 个 子 节点 或 父 节 点 不 存在 ， 则 
相应 域 中 有 值 NIL。 根 节点 是 树 中 瞧 一 的 父 节 点 措 针 域 为 NIL 的 节点 . 

二 又 查找 树 中 关键 字 的 存储 方式 满足 二 又 查找 树 性 质 : 

设 区 为 二 巡查 找 树 中 的 一 个 节点 。 如 果 y 是 x 的 堪 子 畦 中 的 一 个 节点 ， 则 Key[ 中 去 
keyfx]。 如 果 y 是 x 的 右 子 树 中 的 一 个 节点 ， 则 keyfx] 过 keyfy]. 

在 图 13.1(a) 中 ， 根 节点 的 关键 字 为 5， 其 左 子 树 中 的 关键 字 2.3 和 5 都 不 大 于 $ 其 右 
子 树 中 的 关键 字 7 了 和 8 都 不 小 于 5。 这 个 性 质 对 树 中 其 他 各 节点 均 成 立 。 例如， 图 13.t(a) 中 
关键 字 3 不 小 于 其 左 子 树 中 的 关键 字 2， 且 不 大 于 其 右 子 树 中 的 关键 字 5。 

根据 二 叉 查 找 树 性 质 ， 我 们 可 用 一 个 递归 算法 来 按 序 印 岂 树 中 的 所 有 关键 字 。 该 算法 称 
为 中 序 遍 历 算法 ， 因 为 某 子 树 根 的 关键 字 在 被 印 出 时 是 介 于 其 左 子 树 中 的 关键 字 和 其 右 子 树 
的 关键 字 之 间 的 (类 似 地 ， 前 序 示 历 中 根 的 关键 字 在 其 子 树 中 关键 字 之 前 印 出 ; 后 序 刘 历 中 
根 的 关键 字 在 其 子 树 中 关键 字 之 后 印 出 ) 下 面 给 出 了 一 个 过 程 
INORDER~TREE-WALKI(x)， 只 要 调用 INORPDER-TREE-WALKCrootfIh) 就 可 印 出 一 
标 二 叉 查 找 树 T 中 的 全 部 元 素 : 
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INORPER-TREE-WALK(x) 


1] iTxMNIL 

了 then 【NOREER-TREE 一 WAA 工 信人 left[fxh) 

3 Print key[x] 

才 INORPER-TREE-WALKfIrght[x 


如 图 13.1 所 示 , 对 任意 节点 x，x 左 子 树 中 的 关键 字 至 多 为 key[xl]。 而 x 的 右 子 概 中 的 
关键 字 至 少 为 key[x]。 不同 的 二 叉 查找 树 可 以 表示 相间 的 值 集 。 天 部 分 的 查找 树 操作 的 最 坏 
情况 运行 时 旬 与 树 的 高 度 成 正比 ，{a)j 一 覃 有 六 个 节点 、 高 度 为 2 的 查找 树 。 (b) 另 一 棵 
高 度 为 4、 包含 同样 的 关键 字 但 效率 较 低 的 二 叉 查 找 树 。 这 个 过 程 应 用 平 图 中 的 两 棵 一 叉 查 
找 树 时 ， 按 中 序 印 出 关键 宇 序列 2.3,5,5.78。 要 证 明 本 算法 的 正确 性 ， 直 接 对 二 叉 查 找 树 性 
质 作 归纳 即 可 。 毅 历 一 棵 有 n 个 节点 的 二 叉 查 找 树 的 时 间 为 @@(nD)， 因 为 在 第 一 次 调用 遍历 
过 程 后 ， 对 树 中 的 每 个 节点 该 过 程 都 要 被 递归 调用 两 次 ~ 一 一 次 是 对 其 左 子 节点 ， 另 一 次 是 
对 其 右 子 节 点 - 





(Ba) 


图 1.1 .…. 训 查 找 树 


13.2 查询 二 叉 查 找 树 


对 二 又 查找 树 的 最 经 常 的 操作 是 查 授 树 中 的 某 个 关键 字 。 除 了 SEARCH 操作 外 ， 二 叉 
查找 树 还 能 支持 诸如 MINIMUM、MAXIMUM、SUCCESSOR 和 PREDECESSOR 等 查 
询 。 这 一 节 我 们 来 讨论 这 些 操 作 ， 并 说 明 对 高 度 为 h 的 树 ， 它 们 都 可 在 器 ) 峙 完成 。 


查找 


2 们 用 下 面 的 过 程 来 在 树 中 查找 一 个 给 定 的 关键 字 。 给 定 指向 树 根 的 指针 和 关键 字 攻 ， 
-2EE-SEARCH 返回 指 商 包 含 关 键 字 k 的 节点 (车 存 在 的 话 ) 的 指针 ; 和 否则， 返回 


1 
和 
: 


TREE-SEARCHILIX kkD) 
1 ifx=NIL or 上 =Key[x] 
了 then getuta 大 
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3 放 K<keytxl 
和 then retarm 了 TREE-SEARCHUefL[x] ,kk) 
和 else Teturn 工 REE 一 S 王 和 RCHCright[x],K) 





图 13.2 二 及 查找 树 上 的 查询 


这 个 过 程 从 树 的 根 节点 开始 查找 ， 并 沿 着 树 下 降 ， 如 图 13.2 所 示 , 为 在 树 中 查找 关键 
字 13， 要 避 循 从 根 开始 的 路 径 15-*6->7->13。 树 中 的 最 小 关键 字 为 2， 它 可 以 通过 从 根 开 
始 沿 left 指针 寻找 而 找到 。 最 大 关键 字 20 可 从 根 开 始 沿 right. 指 针 下 降 而 找到 。 关 键 字 为 
15 的 节点 的 后 继 是 关键 字 为 17 的 节点 ， 因 为 它 是 15 的 右 子 树 中 的 最 小 关键 字 。 关 键 字 为 
13 的 节点 没有 右 子 树 ， 故 它 的 后 继 为 其 最 低 的 祖先 ， 该 祖先 的 左 孩 子 也 是 个 祖先 。 在 这 种 
<* 况 下 ， 关 键 字 为 15 的 节点 为 其 后 继 。 对 碰 到 的 每 个 节点 x， 就 出 较 k 和 key[xj]。 如 果 这 
两 个 关键 字 相 同 ， 则 查找 结束 ， 如 果 k 小 于 key[x]， 则 继续 查找 x 的 左 子 树 ， 因 为 由 二 又 查 
g 树 性 质 可 知 k 不 可 能 在 x 的 右 子 树 中 。 对 称 地 ， 如 果 k 大 于 key[xl]， 则 继续 在 x 的 右 子 树 
书 查 找 。 在 递归 查找 过 程 中 遇 到 的 节点 构成 了 一 条 由 树 根 下 降 的 路 径 ， 故 本 算法 的 运行 时 间 
晴 O()，h 是 树 的 高 度 ， 四 
我 全 也 可 用 while 循环 来 代替 本 过 程 中 的 递归 。 在 大 多 数 计 算 机 上 ， 非 递归 版 本 运行 得 

要 更 快 一 些 。 ， 

ITERATJVE 一 TREE-SEARCHIx:K) 

1 While  x 关 MIL and Jec 大 key[x] 

2 do 这 攻 <Key[x] 2 

3 then Xe ieftfx] 


4 else Xe-Tight[x] 
和 Tettn 其 


最 大 元 素 和 晤 小 元 素 


要 查找 二 又 查找 树 中 具有 最 小 关键 字 的 元 素 ， 只 要 从 根 节 点 开始 ， 沿 着 各 节点 的 left 指 

针 查 找 下 去 ， 直 至 遇 到 NIL 为 止 ， 如 图 13.2 所 未 。 下 面 的 过 程 返 回 一 个 指向 以 给 定 节 局 x 
为 报 的 子 树 最 小 元 素 的 指针 。 
TREE-MINIMUMI(X) 


1 while 1eEt[x]=WTEL 
2 中 n XIetx] 
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了 retufn 关 


二 及 查找 树 性 质保 证 了 TREE-MINIMUM 的 正确 性 ， 如 黑 - 一 个 节点 大 无 左 子 树 ， 共 、 
右 子 树 中 的 每 个 关键 字 都 全 少 和 keyfxj… 样 ， 财 以 x 为 根 的 工 树 市 的 和 小 关 鱼 了 注 就 是 
key[fxj。 如 果 节 点 区 有 堪 子 树 ， 因 其 左 计 树 中 的 关键 字 都 个 天王 keybgj， 而 其 右 子 树 中 的 天 
键 字 都 不 小 于 keyE]， 所 以 以 x 为 根 的 子 树 中 的 最 小 关键 字 可 在 以 iefx 方 根 的 无 了 树 中 找 
到 。 
过 程 TREE-MAXIMUM 的 的 代码 是 对 称 的 : 
TREE-MAXTIMUNMIx) 
1  wRile rigkht[x]- 二 NIL 


2 旭 D Xiett[x] 
3 teturmn 只 


对 次 座 为 上 的 树 ， 这 两 个 过 程 的 运行 时 间 都 是 D(h). 
前 超 和 后 继 


给 定 一 个 二 叉 查 找 树 中 的 节点 ， 有 时 候 要 求 出 在 中 丹 挡 岳 下 它 的 后 继 。 如 果 所 有 的 艾 键 
字 敬 不 相隔， 则 某 节 点 x 的 后 继 即 具 有 大 于 keyfx] 中 的 关键 字 中 最 小 者 的 那个 攻 点 。 根 据 二 - 
及 查找 树 的 结构 ， 我 们 不 用 做 任何 比较 就 可 找到 某 节 点 的 后 继 。 下 面 的 过 程 对 一 叉 查 找 树 中 
的 某 节 点 xx 返回 其 后 继 (如 果 存 在 的 话 ) 或 NIL( 如 果 x 有 树 中 最 大 关键 宇 的 话 ) 
TREE-SUCCESSORIx) 
1 评 切 gbt[x]- 关 NIL 
2 then ITeturn TREE-MTNIMUMITighi[x]) 
3 ys*-pb] 
4 wbhile y< 上 MIL and x 一 古训 ht[y] 
$ 避 D < 了 
1 yp[y| 
了 meturn 站 
TREE-SUCCESSOR 的 代码 中 包含 两 种 情况 。 如 果 节 点 X 的 右 子 树 非 空 ， 则 x 的 后 继 
由 看 子 树 中 的 最 去 节点 ， 在 第 2 行 中 通过 请 用 TREE-MIJNIMUMIrightfDxD 订 以 找到 这 全 他 
点 。 例 如 ， 在 图 13.2 中 包含 关 链 字 15 和 葛 节点 的 后 继 为 包含 关键 字 17 的 节点 。 
另 -- 方 面 ， 如 果 节 点 x 的 右 子 树 为 空 ， 旦 x 有 后 继 y， 则 y 是 x 的 最 低 的 一 个 祖先 节 
点 ， 且 Y 的 左 儿 子 也 是 X 的 祖先 。 在 图 13.2 中 ， 包 含 关键 字 13 的 节点 的 后 继 为 包含 关键 字 
J5 的 节点 。 为 找到 y， 可 从 x 向 上 查找 ， 直 至 遇 到 某 个 是 其 们 节点 的 玫 几 和子 的 节 点 为 省。 
TREE-SUCCESSOR 中 的 第 3 一 7 行 完 成 这 一 工作 。 
对 高 度 为 h 的 一 棵 树 ， 该 算法 的 运行 时 间 为 Dth)。 过程 TREE-PREPDECESSOR 与 
TREE-SUCCESSOR 对 称 ， 其 运行 时 间 也 是 O(h)。 
我 们 可 用 下 面 的 定理 来 对 上 述 内 容 作 个 总 结 : 
定理 13.1 对 一 标高 度 为 h 的 二 叉 查找 树 ， 动 态 集合 操作 SEARCH, MINIMUML 
MAXIMUM, SUCCESSOR 和 PREDECESSOR 等 的 运行 时间 艾 为 Oh)， 


一 168 一 


13.3 插 人 和 删除 


播 和 信和 删除 操作 会 引起 以 一 多 姐 找 树 玖 示 的 动态 集 仓 的 变化 。 上 昌 反 上 映 划 这 种 变化 就 要 他 
改 数据 绪 构 ， 伺 丰 修改 的 问 时 还 要 保持 一 义 查 找 树 性 质 。 我 们 将 看 到 ， 为 插入 一 新 元 素 币 修 
收 权 结构 相对 来 说 较 简 单 ， 旬 在 有 删 除 操作 时 情况 要 复杂 一 点 。 

揪 入 

为 将 一 个 新 值 v 插入 人 一 叉 查 找 情 T， 可 调 骨 过 程 TREE-INSERT。 传 络 该 过 程 的 参数 
是 个 节点 z， 朋 有 keyfzl=v，left[z=NIL，right[z=MNIL。 该 过程 修改 立 和 z 的 某 些 域 ， 
并 把 z 插 人 树 中 的 适当 位 置 。 

TREE-NSERTIT,z) 
1 ye 和 NIL 


2 Xe-Toot[T] 
3 W 间 1 xx- 坟 MiL 


十 对 DY - 艺 

4 让 Key 四 一 key[x] 

各 thenh Xe--Leftix] 
7 。 虽 se Xe -Tightx] 
8 Hizl*-y 

9 这 y= 区 jL 


10 hen root[TH .z 

] 1: Else 认 攻 ey[zl< 一 key[y] 

j2 them le 代 [y]< 一 z 
13 ese Tjgihtiy]= 一 z 


图 13.3 示 站 了 这 个 等 法 的 工作 过 程 ， 各 浅 人 阴影 节 点 指示 了 从 根 到 该 项 被 插 人 位 置 间 的 
路 和 从。 虚线 指 示 了 为 将 该 项 播 人 树 中 而 增加 的 链接 。 像 TREE-SEARCH 利 
ITERATIVE-SEARCH -- 样 ，TREE--TNSERT 从 根 节点 开始 ， 并 沿 树 下 降 。 指 针 x 跟踪 
了 这 条 路 答 ， 布 y 始终 指向 x 的 父 节 点 。 在 初始 化 后 ， 第 37 行 中 的 while 循环 使 这 两 个 指 
针 祝 权 下 降 ， 根 据 key[ 了 与 key[ 芭 的 比较 结果 , 可 以 决定 阿 堪 或 向 丰 转 ， 直 到 x 成 为 NIL， 
这 个 NIL 所 占 位 置 即 我 们 起 搬 人 项 z 前 地 方 。 第 8-13 行 置 有 关 z 的 指针 。 





图 13.3 ”将 关键 字 为 13 的 项 播 人 一 棵 二 允 查 找 树 
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和 其 他 查找 树 上 的 原始 操作 一 样 ， 过 程 TREE_TNSERT 的 运行 时 间 为 O(n),b 为 树 的 
高 度 . 





图 13.4 从 一 标 二 有 查找 树 中 删除 一 个 节点 z 


弄 除 


将 给 定 节 点 z 从 二 叉 查 找 树 山内 的 过 程 以 指向 z 的 痢 针 为 参数 ， 并 考虑 了 如 图 13.4 所 
示 的 三 种 情况 。 如 果 工 没有 子女 ， 则 修改 其 父 节 点 PE 中， 使 NIL 为 其 子女 ; 如 林 节 点 z 只 
有 一 个 子女 ， 则 可 通过 在 其 子 节 点 与 父 节 点 间 建 立 一 条 链 来 删除 z。 最 后 ， 如 果 节 点 上 有 两 
个 子女 ， 先 删除 z 的 后 继 X 它 没有 左 子女 , 网 练习 13.3- 和 ， 再 用 y 的 内 容 来 蔡 代 z 的 内 雁 。 
过 程 TREE-DELETE 中 这 三 种 情况 的 组 织 略 有 不 同 。 


TREE-DELETECT.z) 
TI 这 leftz] 王 NIL or 帮 Eghtlz]= NIL 
之 then Ye 一 2z 
else ya-TREE-SUCCESSOR(z) 
这 leftyHNIL 
then XieftIy] 
else Xe-Tight[yi 
让 x 关 MNIL 
then jp[xj<-ply] ， 
9 让 pPitg= NIL < 
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to -上 合 Un 上 证 


1 then root[T]<x 
11] else 达 y 一 jeftIpIyl 


12 then le 全 [pfyj]-< 一 x 

[3 . else Tight[pfy]-< 一 x 

14 这 了 < 关 z - 

15 then Keyfz]<-key[y] 

16 信 如 时 了 有 其 他 域 , 世 要 对 宅 们 进行 复制 
17 Feturn y ， 


在 第 1-3 行 中 ， 算 法 确定 要 删除 的 节点 y。% 略 节点 或 者 是 输入 节点 z( 如 果 z 至 多 只 有 
一 个 于 嫉 )， 或 者 是 z 的 后 继 ( 如 果 z 有 两 个 子女 )。 然后， 在 第 4-6 行 中 ，x 被 置 为 y 的 非 
NIL 的 子女 ， 或 当 了 无 子女 的 被 置 为 NIL。 第 7-13 中 ， 通 过 修改 p[y] 和 x 中 的 指针 将 y 删 
除 。 在 考 感 到 边界 条 件 ， 即 x= NIL 或 y 为 根 节点 时 ， 对 y 的 删除 就 有 点 复杂 了 。 最 后 ， 在 
第 14-16 行 中 ， 如 果 z 的 后 继 就 是 要 被 删除 的 节点 ， 则 将 y 中 的 内 容 复 制 到 z 中 ， 从 而 覆盖 
子 z 中 先前 的 内 容 。 第 17 行 返回 节点 y。 对 高 度 为 h 的 树 ， 该 过 程 的 运行 时 间 为 Ofb) 

总 之 ， 我 们 证 明了 下 面 的 定理 : 

定理 13.2 对 痪 度 为 h 的 二 又 查找 树 ， 动 态 集合 操作 INSERT 和 DELETE 的 运行 时 
间 为 Dthy)。 


* 13.4 随机 构造 的 二 叉 查 找 树 


我 们 已 经 知道 ，-- 叉 查找 树 上 的 基本 操作 的 运行 时 间 都 是 Of(hb)，h 为 树 的 高 度 。 但 
是 ， 随 着 元 素 的 被 插 人 或 被 删除 ， 树 的 高 度 会 发 生变 化 。 为 了 分 析 实 践 中 二 又 查找 树 的 性 
能 ， 有 必要 对 关键 字 的 分 布 以 及 插 人 先 删 除 的 序列 作 一 些 统计 假设 ， 

如 果 在 构造 二 马 查 树 时 妍 用 到 插 人 操作 又 用 色 导 除 操作 时 ， 很 难 确定 树 的 平均 高 度 到 底 
是 多 少 。 如 果 仅 用 播 人 操作 来 构造 树 ， 则 分 析 相 对 容易 些 ，。 我 们 可 以 定义 在 n 个 不 同 的 关 
键 字 上 的 一 棵 随机 构造 的 二 叉 查 找 树 ， 它 是 通过 按 随 机 的 顺序 将 各 关键 字 插 人 一 棵 初始 为 空 
的 树 而 梅 成 的 ， 且 关键 字 的 ml 种 排列 是 等 可 能 的 。 这 一 节理 证 明 在 n 个 关键 字 上 随机 构造 
的 二 叉 查 找 树 的 期 望 高 度 为 Of 1g nm)。 

先 来 看 仅 通过 插 人 而 建成 的 二 叉 查 找 树 的 结构 。 

引 理 13.3 设 工 为 通过 将 nm 个 不 同 的 关键 字 ki， ，…，k( 按 序 ) 插 人 一 棵 初始 为 空 的 
一 叉 查 找 树 而 构成 的 树 。 对 1 和 i<j 科 n， 拓 是 ki; 的 祖先 ， 当 且 仅 当 

ki=minfi: 1<1<i 且 如 >k} 
或 
扑 一 maxtk: 1 过 1 委 i 且 区 <k 

证 明 : ”一 : 假设 ki 是 ki 的 祖先 。 考 虑 揪 人 关键 字 kuk…' 水 后 的 树 研 。 在 T 中 从 根 
太 氮 玫 j 的 路 径 与 了 中 从 根 节点 至 k 的 路 人 径 是 一 样 的 。 如 果 将 k 揪 到 Ti 中 ， 则 它 或 是 k 
的 左 子女 ， 或 是 ki 的 右 子女 , 因而 ( 见 练习 13.2-- 全 ，ki 或 者 是 nk 攻 i 中 大 于 反 的 最 小 关 
链 字 ， 或 者 是 kjk>… 必 中 小 于 后 的 最 大 关键 字 。 

<: 假设 kx 是 kk 上 中 大 于 的 最 小 关键 字 ( 对 ki 为 khk2 ki 中 小 于 k 的 最 大 关 
键 字 的 情况 可 对 称 处理 )。 将 二 与 工 的 从 根 至 ki 的 路 径 上 上 所 有 关 键 字 比 较 的 顷 果 和 将 与 
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这 些 关 键 字 比 较 的 结果 是 一 样 的 。 因而 ， 当 多 要 被 插 人 时 ， 它 沿 着 通过 k 的 -一 条 路 径 被 揪 
入 ， 成 为 5 的 后 代 ，、 
作为 引 理 13.3 的 一 个 推论 ， 我 们 可 以 准确 地 描述 出 在 特定 的 输入 排列 时 某 个 关键 室 的 

深度 。 
推论 13.4 设 了 为 将 n 个 不 同 的 关键 字 kika…:ka( 按 序 ) 插 和 人 一 棵 初始 为 空 的 一 叉 查找 
树 中 所 构成 的 ， 对 某 个 给 定 的 关键 字 的 ，1 乞 j 乞 n。 定 义 : 
Gi={ki Ts<i<j 且 Xi>k>g， 对 所 有 满足 ki>E 的 1< 计 
以 及 


则 从 根 至 的 路 径 上 的 关键 字 恰 为 G jL 中 的 关键 字 ， 旦 中 任意 关键 字 K 的 深度 为 
dxD=IGHIEL 





(aa 








2194237123 0 2 636 1 
呈 21 25 19 29 
| 21 19 
已 9 4 7 13 增 
已 颖 12 


(by 
睫 13.5 ”两 个 包 售 从 一 覃 二 叉 查 找 树 的 根 和 至 关 链 字 Ki= 17 的 路 径 上 的 关键 字 的 集合 Gi 和 Li 


图 13.5 示 出 了 两 个 集合 的 和 Di。 (a) Gj 中 具有 关键 字 的 节点 是 黑色 的 ， 而 Li 中 具有 
关键 字 的 节点 是 白色 的 。 所 有 其 他 节点 都 加 了 阴影 。 从 根 至 具有 关键 字 ki 的 路 径 也 加 了 阴 
影 ， 虚 线 左 边 的 关键 字 都 小 于 与 ， 右 边 的 关键 字 都 大 于 扫 。 这 棵 树 是 通过 将 〈b) 中 表 项 端 
所 示 的 关键 字 捅 人 而 构成 的 。 集 合 G ij={21，25，19，29} 包 售 了 大 于 17 且 在 17 之 前 播 
人 的 那些 元 素 。 集 合 人 = {21，19} 包 含 了 对 台 | 中 的 最 小 元 素 进行 更 新 的 元 素 。 这 样 ， 关 
键 字 21 在 G; 中 ， 因 为 它 是 第 一 个 元 素 。 关 键 字 19 在 Gi 中 ， 因 为 它 小 于 当前 最 小 值 21。 
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关键 字 29 不 在 G; 中 ， 因 为 它 大 于 当前 最 小 值 19. 王 ″ ; 和 1 的 结构 是 对 称 的 集合 人 中 包 
含 了 在 二 之 前 插 人 的 关键 字 kt， 且 ki 为 kukz…x 中 大 于 5 的 最 小 关键 字 (LI 的 结构 是 对 称 ， 
的 )。 为 了 更 好 地 理解 集合 Gj， 我 们 可 以 找 出 一 个 方法 来 枚 举 其 元 素 。 在 关键 字 kk :Ki-， 
中 ， 按 序 地 考虑 大 于 k 的 那些 关键 宇 。 在 图 中 这 些 关键 字 构成 集合 G'。 在 顺序 考虑 每 个 元 
素 时 ， 始 终 记 下 最 小 的 元 素 。 集 合 G 中 由 更 新 最 小 元 素 过 程 中 的 各 元 素 构 成 。 

为 便于 分 析 ， 可 对 上 述 情况 作 些 简 化。 假设 na 个 不 同 的 关键 字 被 一 次 一 个 地 插 人 一 个 
动态 集合 中 去 。 如 果 这 mn 个 数 的 所 有 排列 都 是 等 可 能 的 ， 则 平均 来 说 该 集合 的 最 小 元 素 要 
改变 多 少 次 ?为 回答 这 个 问题 ， 假 设 第 让 个 被 播 人 的 数 是 k:i= 152,…,a。ki 是 前 i 个 数 中 最 
小 者 的 概率 为 T/i 因为 排 在 前 i 个 数 中 任何 一 个 位 置 上 的 可 能 性 是 相同 的 。 这样， 集合 
中 最 小 元 素 改 变 的 期 望 次 数 为 “ 

Zi 一 ， 


其 中 H,=ln nHO() 为 第 mn 个 调和 数 (名 等 式 (3.3) 和 问题 6-2)。 
. 捐 据 上 式 ， 我 们 可 以 预期 最 小 元 素 的 改变 次 数 大 约 为 nn; 下面 的 引 理 说 明了 这 个 概率 
变 得 大 得 多 的 可 能 性 是 很 小 网。 

引 惠 13.5” 设 : Ki ko 上 ,为 贡 个 不 周 的 数 的 一 个 随机 排列 ， [SI 为 表示 下 面 集合 的 基数 
的 随 袖 变量: 

S=jdki: 1 入 i 和 n 且 区 > 区 1< 计 【13.1 
则 Prfls|>4H<17m， 其 中 H 是 第 ha 个 调和 数 。 

证 明 : ”我 们 可 以 认为 集合 $ 的 基数 是 由 na 次 伯 努 利 诚 验 决定 的 ， 其 中 当 k 小 于 元 素 
kk 时 第 1 次 试验 为 成 功 ， 且 其 概率 为 17i。 各 次 试验 是 独立 的 ， 因 为 攻 ; 是 kk2…， 
3 中 最 小 元 素 的 概率 独立 于 kbkz>… 光 -il 之 间 的 相对 次 序 。 

我 们 可 以 利用 定理 66 来 给 出 PrflSl>4H } 的 一 个 界 。| 引 的 期 望 为 上 = Hz>linni 又 根 
据 等 式 (3.12)， 所 各 为 ; 

2 ] 
2) 
"T 1 + 
“全 
”过 型 一 二 地 
乏 lnn 
这 样 ， 根 据 定 理 6.6 可 得 : 
PrflS| 关 4H } = Prfls| 一 w>3H ，)} 
一 GH 了 
芭 -oa?av an 


一 从 “4nn 
一 疡 


一 本 
一 缮 


委 17n 
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现在， 我 们 就 能 给 出 一 棵 随机 构造 的 二 叉 查 找 树 高 度 的 界 了 。 
定理 13.6 ”由 拉 个 不 同 的 关键 字 随 机 构造 而 成 的 二 叉 查 找 树 的 平均 高 度 为 DO(zg 器。 
证 明 : ” 设 kk 为 个 关键 字 的 随机 排列 ， 并 设 T 为 将 这 些 关 键 字 按 序 播 人 一 
棵 空 树 而 建成 的 二 叉 查找 树 。 首 先 们 考虑 -下 集 个 给 定 的 关键 字 5 的 深度 dki'T) 至 少 为 t 
的 概率 。 根 据 推论 13.4， 如 果 5 的 深度 至 少 为 t ， 则 集合 Gi 和 Li 之 一 的 基数 必须 圣 少 为 
tv 2。 于 是 有 : 
priagc tsPrlGl>tz2HPrILI>t {13.2) 
先 看 PrflGzt7 分 。 我 们 有 
PrilG>t73] 
一 Prl 人 ti 1 所 i<j 且 苹 > 区 > 其 ，1< 训 | 兰 t7 2 
委 了 Pr 人 i 委 和 县 区 >k< 计 兰 t7 2 
=PrflS 「 tv 23) 
其 中 8 在 等 式 (13.0 中 定义 。 请 注意 7 当 我 们 将 i 的 变化 范围 从 i<j 扩大 到 isn 时 ， 上 曾 的 
概率 并 不 减 小 ， 这 是 因为 并 淮 有 向 集合 中 加 进 任何 新 的 元 素 。 类 似 地 ， 如 果 我 们 去 掉 条 件 
ki>J5， 概 率 也 并 不 减 小 ， 因 为 我 们 是 在 用 可 能 少 于 na 个 的 元 素 ( 大 于 5 的 那些 切 ) 的 一 个 随 
机 排列 来 代替 n 个 元 素 上 的 随机 排列 . 
对 称 地 ， 我 们 可 证 明 : 
Pr{|Ei| 兰 t7 引 乏 PrtlSl 关 t7 24 
这 样 ， 根 据 不 等 式 (13.2) 可 得 
Prfidfk: ,T) 减 侠 乏 2PrflS 主 t7 2 
如 果 我 们 选择 + 8H.,， 此 处 百 , 为 第 i 个 调和 数 ， 则 可 应 用 引 理 13.5 得 到 
Prfdf(kD 关 8H <2PrflSl 关 4H 
<<27 
因为 在 一 棵 随机 构造 的 二 叉 查 找 树 中 至 多 有 个 节点 ， 根 据 布尔 不 等 式 (6.22)， 其 中 任 
一 节点 的 深度 竺 少 为 8H, 的 概率 至 多 为 n(2/ 呈 =27n。 因此， 在 至 少 1-27am 的 时 间 里 ， 
一 棵 随机 构造 的 二 叉 查 找 树 的 高 度 为 8H,， 在 至 多 2yn 的 时 间 里 ， 树 的 高 度 至 多 为 0。 总 
之 ， 期 望 的 高 度 至 铬 为 (8 开 ,J(1-27 mHTn(27 可 =ODLISDI。 


思考 题 


13_1 具有 相同 关键 字 的 二 叉 查 找 树 


相同 关键 字 的 存在 给 二 叉 查 找 树 的 实现 带 来 了 一 些 问 题 . 
a. 当 用 TREE-INSERT 将 nm 个 相同 的 关键 字 插 人 一 个 初始 为 空 的 二 叉 查 找 树 时 ， 该 算 
法 的 渐 近 性 能 如 何 ? 
我 们 可 对 TREE-INSERT 作 一 些 改进 ， 即 在 第 5 行 前 面 测试 key[ 四 = key[x]， 在 第 11 
行 前 面 测试 key 四 = key[y]。 如 果 等 式 成 立 ， 我 们 对 下 列 策 赂 中 的 某 一 种 加 以 实现 。 对 每 一 
种 策略 ， 请 给 出 将 hn 个 相同 的 关键 字 插 人 一 棵 初始 为 空 的 二 叉 找 树 中 的 渐 近 性 能 { 第 5 行 描 
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述 了 各 种 策略 ， 并 比较 z 和 x 的 关键 字 )。 

b. 在 节点 大 处 设 一 布尔 标志 b[z]， 它 在 TREE-INSERT 每 次 访问 该 节点 时 取 TRUE ， 
或 FALSE。 根 据 b[z] 的 不 同 值 ， 置 x 为 ,left[x] 或 right[zxj. 

c. 在 节点 处 设 一 由 具有 相同 关键 字 的 节点 构成 的 表 ， 并 将 z 插 入 该 才 。 

d. 随机 地 将 x 置 为 jsft[xl 或 right[x]( 给 出 最 坏 情 况 性 能 , 并 非 形式 地 导出 平均 情况 性 
能 ) 。 


13-2 基数 树 


给 定 两 个 昌 a= aoal…an 和 b= bobl…b， 其 中 每 个 a 和 bi 属于 某 有 序 字符 集 ， 如 洒 下 
面 两 条 规则 之 一 成 立 , 则 说 串 a 按 字典 序 小 于 中 b: 

1. 存在 一 个 整数 j， 0 过 j 乏 min(p,qj)， 使 a=bi=01… 六 1， 且 a<bi 

2.p<q 且 aa=bi， 对 所 有 i=015…p 成 立 。 

例如 ， 如 果 a 和 hb 是 位 串 ， 则 根据 规则 1( 设 j=3) 有 10100< 10110， 入 淆 规 交 2 有 
10100< 101000， 这 与 英语 字 黑 中 的 排序 很 相似 。 

图 13.6 中 所 示 的 基数 树 存储 了 位 串 1011,10,011,100 和 0。 当 查 找 某 关键 字 a= aoai…a 
时 ， 在 深度 为 i 的 一 个 节点 处 若 a=0， 则 向 左 转 ; 若 a=1 则 向 右 转 。 设 $ 为 一 组 不 同 的 二 
进 串 构成 的 集合 ， 各 串 的 长 度 之 和 为 mn。 说 明 如 何 利 用 基数 树 在 @(n) 时 间 内 将 8 按 字 典 序 
排序 。 例 如 对 图 13.6 每 个 节点 的 关键 字 , 可 通过 遍历 从 根 至 该 节点 的 路 径 而 确定 。 因 而 ， 没 
有 必要 将 关键 字 存 储 在 节点 中 , 图 中 示 出 的 关键 字 仅 为 说 明之 用 。 与 加 了 重 阴 影 的 节 操 为 对 
应 的 关键 字 不 在 树 中 ， 这 样 的 节点 的 存在 仅 是 为 了 建立 与 其 他 节点 之 间 的 通路 。 排序 的 输出 
序列 应 是 和，011, 10, 100, 1011。 





图 13.6- 一 宰 存 情 了 位 串 1011，10，011，100 相 0 的 基 树 
13-3 随机 构造 的 二 又 查 找 树 中 平均 节点 深度 


在 这 个 问题 里 , 我 们 要 证 明 在 一 棵 随机 构造 的 二 又 查 树 中 节点 的 平均 深度 为 Dig 中。 虽 
然 这 个 结果 绸 于 定理 13.6， 但 我 们 将 采用 的 技术 却 会 揭示 出 构造 二 叉 查 找 树 与 8.3 节 中 
RANDOMIZED-QUICKESORT 的 运行 之 癌 司 的 相似 性 。 


我 们 在 第 五 章 中 介绍 过 ,二叉树 T 中 内 路 径 长 床 RED 为 开 中 所 有 节点 和 的 这 度 之 和 ， 
表示 为 dfxT)。 
a. 论证 ; T 下 点 的 下 生计 为 


二 dr 也 = = P(T) 


进而 ， 我 们 项 望 证 PCT) 的 期 户 值 为 Dn lg 
b. 设 症 和 Tr 表示 树 开 的 左 、 右 子 树 ， 论 证 : 如 果 了 有 个 节点 ， 则 有 
PITD=POTDHPCTHn 一 1 
设 PCo) 雪 示 一 哥 包 售 a 个 节点 的 随机 构造 又 树 中 的 平均 内 路 径 长 度 。 证 明 : 
PO) = 上 工 (pO + Po 一 i 一 D+a-D 


刀 . 证 明 : ee 
Ptn) 一 二 2 Pdk) 十 昌 (n) 


台 . 加 人 六 西 过 的 对 如 排放 的 了 机 化 版本 的 分 析 | 上 结 
P(n= 一 On lz 芭 
在 对 快速 排序 算法 的 每 次 调用 中 ， 我 们 随机 地 选择 一 个 支点 元 素来 进行 划分 。 二 叉 查 找 
树 中 的 每 个 节点 也 对 以 该 节点 为 根 的 子 树 中 的 所 有 元 素 进 行 划 分 。 
f 请 给 出 快速 排序 的 一 种 实现 ， 使 其 中 为 排序 一 组 元 素 而 做 的 比较 与 将 这 些 元 素 插 人 一 
棵 二 叉 查 找 树 所 做 的 比较 是 正好 一 样 的 (所 全 的 各 次 比较 的 次 序 可 能 不 同 )。 


13-4 不 同 的 二 叉 树 数目 


设 bn 表示 包含 个 节点 的 不 同 的 二 又 树 的 数目 ， 在 这 个 问题 里 ， 我 们 要 给 出 关于 bn 的 


公式 和 一 个 渐 近 估计 . 
8a. 证 明 : bo 二 1， 且 对 mmz1 
b ,== 记 bsb。i 


”Pb. 设 B(z) 为 生成 函数 


Bfx) 一 了 b 和 二 


此 一 由 


(生成 本 数 的 定义 见 间 题 4 一 6) 证 明 : 
.BC = xBG092 + 1， 因 而 
BO = 二 (Vi 二 术 ) 
在 点 x = 3 处 fCo9 的 泰勒 展 式 为 
K 人 (一 a] NE 
切 一 一 


其 中 他 (是 在 点 zx 处 f 的 k 阶 导数 。 
,证 明 : 
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b (1 +OL nn) 


4 
六 mn 
练习 十 三 


13.1-1 闻 出 基于 关键 字 梨 合 {1,4.5,10,16,17,21} 的 高 度 为 234.5 和 66 的 二 叉 查 找 醋 。 

13.1~2 二 驴 查找 树 性 质 与 堆 性 质 (7.1) 之 间 有 什么 区 别 ? 能 和 理 利用 堆 性 质 在 Ditm) 时 间 内 按 序 印 出 含有 
nm 个 节点 的 树 中 的 所 有 关键 字 ? 

13.4-3 给 出 一 个 非 递归 的 中 序 树 遍 押 算法 (提示 : 有 两 种 方法 、 较 容易 的 一 种 中 可 采用 栈 必 为 辅助 数 
据 结构 ; 较为 复杂 的 一 个 不 采用 栈 结构 ， 但 恨 设 可 以 测试 两 个 指针 的 相等 性 }。 

13.1-4 对 祝 有 旺 个 节点 的 二 忆 查 找 树 ， 给 出 能 存 包 fa 时 间 内 完成 前 序 遍 历 和 后 座 遍 历 的 递归 算法 . 

13.1-5 论证 : 在 比较 模型 中 ， 最 坏 情况 下 排序 an 个 元 素 的 时 间 为 Pin gm， 刚 为 从 尾 意 的 mn 个 元 素 
中 构造 出 一 覃 二 叉 查 找 香 ， 尾 何 一 个 基于 比较 的 算法 在 最 坏 情 况 下 都 诸 花 Qtn 关外 的 时 间 。 


13.2-1 条 设 在 基 二 多 查找 树 中 有 1 到 1000 之 间 的 一 些 妆 ， 现 要 找 出 数 363。 下 列 的 节点 序列 中 哪 一 
个 不 可 能 是 所 检查 的 序列 ? 
.8.2，252， 401， 398， 330， 344， 397， 363 

b.924， 220， 911， 244， 898， 258， 362， 363 

c.925， 202， 911， 240， 912， 245， 3653 

d. 2，399，387， 219， 266， 382， 381， 278， 363 

ec. 935， 278， 347.，、621， 299， 392， 358， 363 

13.2-2 基 人 认为 他 发 现 了 二 叉 查 找 树 的 一 个 重要 性 质 。 疏 设 在 二 叉 查 找 树 中 对 某 关键 字 友 的 查找 在 
一 叶 节 点 处 结束 , 考虑 三 个 集合 : 入 ， 包 含 理 找 路 径 左 边 的 关键 字 ; B， 和 包含 查 找 政 径 上 的 关键 字 ; C， 包 食 
查找 路 径 右 边 的 关键 字 ， 他 宣称 ， 任 何 三 个 关键 字 aE 和 站，bEB，c&eCe, 都 满足 a 近 bsce。 请 给 出 命题 的 一 
个 反例 ， 

13.2-3 ”利用 二 叉 查 找 树 性 质 来 严格 证 明 TREE-~SUCCESSOR 的 代码 是 正确 的 。 

13.2-4 ”对 一 棵 会 a 个 节点 的 二 叉 查找 树 的 中 序 和 遍 历 可 以 这 样 来 实现 : 先 用 TREE-MINIMUM 找 中 
树 中 的 最 小 元 素 ， 然 后 再 调用 n~1 次 TREE-SUCCESSO 有 R、 证 明 这 个 算法 的 运行 时 和 间 为 @( 中 )。 

.13.2~5 证 明 : 对 高 度 为 h 的 二 叉 查找 树 * 无 论 从 哪个 节点 开始 ， 芒 次 连续 调用 TREE-SUCCESSOR 
的 时 间 为 O(k+b)， 

13.2-6 设 工 为 一 械 二 及 查找 树 ，x 为 一 叶 节 点 ，y 为 王 的 父 节 上 点。 证明 : key[yj 或 者 是 T 中 大 于 
key[zx 的 最 小 元 素 ， 吉 者 是 小 于 key 多] 的 最 大 元 素 ， 


13.3-1 请 写 出 TREE-INSERT 过 程 的 并 归 版 本 。 

13.3-2 扫 设 我 们 通过 重复 揪 人 不 同 的 关键 字 的 懂 法 来 构造 一 棵 二 尺 查 找 树 。 讼 证 : 为 在 树 中 查找 一 
个 关键 字 , 所 检查 的 节点 数 等 于 搬 人 该 关键 字 时 所 检查 的 关键 字数 加 1， 

13.3-3 我们 这 样 来 排序 n 个 数 : 先 构造 一 樟 包 含 这 些 数 的 二 叉 查 找 树 ( 重 复 应 用 TREE--INSERT 来 
插 人 这 些 数 ), 然后 按 中 序 志 历来 印 出 这 些 数 。 这 个 排序 算法 的 最 坏 情 况 和 最 好 情况 运行 时 间 怎 样 ? 


13.3-4 证 明 : 如 果 二 发 查找 树 中 的 某 个 节点 有 两 个 子女 ， 则 其 后 继 没 有 堪 子 女 ， 其 前 趋 没有 右 子 
本 


一 177 一 


_13.3-5 人 息 设 另 有 一 种 数据 结构 中 包含 指向 二 叉 查找 笃 某 节点 y 的 指针 ， 并 假设 用 过 程 TREE-_DE- 
LETE 来 删除 y 的 前 区 z。 这 样 做 会 出 现 哪些 问题 ? 邵 何 改写 TREE-DELETE 来 解雇 这 些 问题 ? 
13.3-6 ”删除 操作 是 可 交换 的 吗 ? (也 就 是 说 ， 先 删除 x， 后 删除 y 的 二 叉 查 找 树 与 先 删除 y 后 蔓 除 x 
一 样 ) 说 明 为 什么 是 的 ， 或 给 出 一 个 反例 。 


13.4-1 请 描述 这 样 的 一 棵 二 飞 查 找 树 : 其 中 每 个 节点 的 平均 深 麻 为 @@flgm， 但 树 的 高 度 为 ml lg。 

如 果 每 个 节点 的 半 均 深度 是 @@( 地 中 的话， 所 合唱 个 节点 的 二 台 查 找 树 的 高 度 可 以 是 和 多少? 

13.4-2 说 明 ; 基于 了 个 关键 字 的 随机 洁 择 的 二 总 查 找 树 概念 (每 棵 包 人 洁 个 节点 的 树 第 选 到 的 可 能 性 
相同 ,。 和 与 这 一 节 中 介绍 的 戎 机 构造 的 二 愁 查找 树 的 概念 是 不 同 的 (提示 :， 列 出 mn=3 时 的 各 种 可 能 )。 

13.4-3* 给 证 一 个 常数 Tz 关 1， 确定 某 个 ft， 使 得 一 棵 随机 构造 的 二 叉 查 找 树 的 高 度 至 少 为 tH, 的 概 
率 小 于 1 7 mr 

13.4-4* “更 对 卫 个 输入 数 调用 RANDOMIZED-QUICKSORT。 证 明 ; 对 任何 毅 数 >0， 输 入 数 
的 所 有 nl 种 排列 中 除了 OU17 09 外 都 有 On lg 站 的 运行 时 间 ， 
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第 十 四 章 ” 红 -- 黑 树 


由 第 十 三 章 我 们 知道 ， 一 棵 高 度 h 的 二 叉 查 找 树 可 以 实现 任何 一 种 基本 的 动态 集合 操 
作 ， 如 SEARCH，PREDECESSOR，SUCCESSOR，MINIMUM，MAXIMUM，IN- 
SERT 和 DELETE 等 ， 其 时 间 都 为 O(h)。 这 样 ， 当 树 的 高 度 较 小 时 ， 这 些 操 作 就 执行 得 较 
快 ， 但 当 树 的 高 度 较 大 时 ， 这 些 操作 的 性 能 可 能 就 与 链表 中 的 差不多 红 -~ 黑 合 是 许多 “十 
奖 的 "查找 树 中 的 一 种 ， 它 能 保证 在 最 坏 情 况 下 动态 集合 操作 的 时 间 为 DUg 中 。 


14.1 红 -- 黑 树 的 性 质 


红 - 黑 树 是 二 叉 查 找 树 ， 但 在 每 个 节点 上 增加 了 一 位 存储 位 表示 该 节点 的 颜色 , 具体 可 
了 是 RED 或 BLACK 。 首 过 对 任 一 条 从 根 到 叶子 的 路 径 上 各 节点 着 色 方 式 的 限制 ， 红 一 黑 
树 确 保 了 没有 一 条 路 径 会 比 任 何其 他 路 径 长 到 两 悦 ， 因 而 基本 上 是 平衡 的 。 

树 中 每 个 节点 得 售 五 个 域 : colorkeyleftiright 和 DP。 如 果 某 节点 的 一 个 子 节 点 或 爸 节 版 
不 存在 ， 则 该 节点 相应 的 指针 域 包含 值 NIL。 我 们 将 把 这 些 NTL 视 为 指向 二 又 查找 树 的 外 
节点 (叶子 ) 的 指针 ， 而 把 带 关 键 字 的 普通 节点 视 为 树 的 内 节 后 。 

一 棵 二 叉 查 找 树 如 果 满 足下 面 的 红 - 黑 性 质 则 为 一 棵 红 一 黑 树 : 

1 每 个 节点 或 是 红 的 ， 或 是 黑 的 。 

2 每 个 叶 节 点 (NID) 是 黑 的 。 

3 如 果 一 个 节点 是 红 的 ， 则 它 的 两 个 子女 都 是 黑 的 。 

4 从 某 一 节点 到 达 其 子孙 时 节点 的 每 一 条 简单 路 径 上 包含 相同 个 数 的 黑 节 点 。 

图 14.1 中 给 出 了 红 -- 黑 树 的 一 个 例子 。 黑 节点 为 黑色 、 红 节点 加 了 浅 阴 影 的 一 棵 红 - 届 
树 中 的 每 个 节点 或 者 是 红 的， 或 者 是 黑 的 ; 每 个 时 子 (NIL) 是 黑 的 ; 一 个 红 节 点 的 所 有 子 
女 都 是 暴 的 ; 每 一 条 从 一 个 节点 至 其 后 代 叶 节点 的 简单 路 径 都 包含 了 相同 数目 的 黑 节 点 。 每 
个 非 NIL 节点 都 被 标 以 其 黑 高 度 ; N 环 的 黑 高 度 为 0。 





图 14.1 ” 红 一 黑 树 的 一 个 例子 
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对 从 某 个 节点 工 册 发 (不 包括 该 节点 ) 到 达 一 个 叶 节 点 的 任意 一 条 路 径 上 的 黑 节 点 个 数 称 


为 该 节点 的 黑 高 度 ， 用 bh(o 表 示 。 根 据 上 面 的 性 质 4， 黑 高 度 概念 是 良 定义 的 ， 因 为 从 该 


节点 出 发 的 所 有 下 降 路 径 玫 有 相同 的 黑 区 点 个 数 ， 红 丹 树 的 黑 高 度 定 义 为 其 根 节点 的 黑 高 
度 。 ， 

下 面 的 引 理 说 明了 红 -- 黑 树 为 什么 是 一 种 比较 好 的 查找 树 。 

引 理 14.1 ”一 棵 含有 a 个 内 节点 的 红 ~ 黑 树 的 高 摩 至 多 为 21jg(n+l)。 

证 有 明 : 先 来 证 明 以 某 一 节点 x 为 根 的 子 树 中 至 少 包 含 2 个 内 节点 。 我 们 通过 对 x 
的 高 度 进行 归纳 来 证 明 这 一 点 。 如 果 x 的 高 度 为 0， 则 x 必 为 一 叶 节 点 (NIEL)， 这 时 以 x 为 
根 的 子 树 包 售 2the0 3 = 20-1=0 个 内 节点 。 对 于 归纳 步骤 ， 考 碟 一 个 其 高 度 为 正 值 的 节点 
x， 它 是 个 内 节点 且 有 两 个 子女 。 每 个 子 妇 根据 其 自身 的 颜 估 是 红 或 黑 面 有 黑 高 度 bh(x) 或 
bh(a~1i。 因 为 x 的 子女 的 融 麻 小 于 工 上 月 身 的 高 度 ， 我 们 可 以 利用 归纳 假设 来 得 出 舒 个 子女 
至 少 包 含 2ph 个 内 节点 。 这 样 ， 以 x 为 根 的 子 嵌 包含 至 少 (28h 一])H2aat 一 1]jH1 
= 一 2ho0 1 个 内 节点 。 这 就 证 明了 前 而 的 断 襄 。 

为 完成 对 引 理 的 证 明 ， 设 h 为 树 的 高 度 。 根 据 性 质 3， 从 根 到 叶 节 点 (不 包括 根 ) 的 任 一 
条 简单 路 征 上 ， 至 少 有 一 串 的 节点 必 是 黑 的 。 从 而 ， 根 的 黑 商 度 至 少 为 av23 故 有 

mn 闻 3 
把 1 移 到 不 等 号 左边 ， 再 对 不 等 式 两 边 取 对 数 ， 得 ljg(n+tD>hv2， 或 hs21g0n+HD。 

由 这 个 引 理 可 知 ， 动 态 集 合 操作 SEARCH、MINIMUM、MAXIMUM、SUCCES- 
SOR 和 PREDECESSOR 可 用 红 一 申 树 在 DQg n) 时 间 内 实现 ， 因 为 这 些 操 作 在 一 标高 度 为 
h 的 二 叉 查 找 树 上 的 运行 时 间 为 DOh 见 第 十 三 章 )， 而 包含 个 节点 的 红 一 黑 树 又 是 高 度 为 
OUg om) 的 二 叉 查 找 树 。 当 给 定 一 棵 红 - 黑 辆 时 ， 第 十 三 章 中 Dllg 辐 的 算法 TREE-INSER 工 
和 TREE-DELETE 的 运行 时 间 为 , DUg m， 但 这 两 个 算法 并 不 直接 支持 动态 集合 操作 JIN- 
SERT 和 DELETE， 因为 它们 并 不 能 保证 被 这 些 操作 改变 了 的 树 仍 然 是 棵 红 一 黑 树 。 然 而 ， 
我 们 将 在 14.3 节 和 14.4 节 中 看 到 ， 这 两 个 操作 确实 可 在 OUg 妇 时 间 内 完成 。 


14.2 旋 转 


当 在 含 a 个 关键 字 的 红 - 黑 树 上 运行 时 ， 查 找 树 操作 TREE-INSERT 和 TREE-~DE- 
LETE 的 时 间 为 DUlg m。 这 两 个 操作 对 树 作 了 修改 ， 结 果 可 能 违反 14.1 节 中 给 出 的 红 ~ 黑 
人 性质。 为 保持 这 些 性 质 ， 就 要 改变 树 中 某 些 节 点 的 颜色 以 及 指针 的 结构 

指针 结构 的 修改 是 通过 旋转 来 完成 的 ， 这 是 一 种 能 保持 关键 字 的 中 组 次 序 的 局 部 操作 . 
14.2 中 示 出 了 两 种 旋转 : 左旋 各 右 旋 。 操 作 RIGHT-ROTATE(T，z) 将 左边 两 个 节点 
的 结构 通过 改动 若干 指针 而 变 为 右边 的 结构 。 通 过 递 操作 LEFT-ROTATE(T，y) 又 可 将 
右边 的 结构 改 为 左边 的 结构 。 这 两 个 节点 可 以 出 现 于 树 中 的 任何 位 置 。 字 址 wk， 及 和? 表示 
任意 子 树 。 旋 转 操 作 保 持 了 关键 字 之 间 的 踊 次序: w 中 的 关键 字 前 于 key[j， 它 又 前 于 有 
中 的 关键 字 ， 有 中 的 关键 字 又 前 于 keyiyl]， 它 又 前 于 》 中 的 关键 字 ， 当 将 某 个 节点 x 左旋 
时 ， 我 们 假设 其 右 孩子 y 是 非 NIL 的 ， 且 旋转 以 x 到 了 之 间 的 链 为 “ 支 轴 ?" 进 行 。 左 旋 的 结 
果 使 得 y 成 为 该 子 树 新 的 根 ，x 成 为 了 的 左 孩 子 ， 而 y 的 左 孩 子 则 成 为 x 的 右 孩 子 . 
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ii IT-ROTATECT， 旋 


1 
LEFF-ROTATEC 好 





图 14.2 二 旭 克 找 树 中 的 旋转 操作 


在 LEFT-ROTATE 的 仿 代 码 中 ， 我 们 假发 5ightlxj 夫 NIL。 


LEEFT_ROTATECTS) 
Y< -Phtfx] 心 设置 Y 


计 leftfy] 关 N1L 
thenm pP[left[y]]<-X 
p[9j<-P[x] 妨 将 x 的 父亲 连接 到 y 
ifEpfxj= NIEL 
then roet[fT|<*-7 
else 让 区 一 1eftip[x]]<- 
then 1e 伍 [PEx]ia 
else right[pfxi<-y 
Te 人 fy] < 一 X 六 将 X 放 到 的 左边 
本 xj]< 闻 


| 
局 二 号 和 


righ 计 xj<-leftfy] 六 特 y 的 堪 子 树 转变 为 xz 的 右 子 树 


图 14.3 示 出 了 TIFFT--ROTATE 操作 过 程 。 树 中 略 皮 了 NIL 叶 丁 ， 对 输入 树 及 修改 语 
的 树 的 中 序 遍 押 产 生 相 同 的 关键 字 值 列表 . RIGHT-ROTIAIE 代码 是 类 似 的 。 两 种 旋转 拘 
作 时 间 都 为 O(D。 另 外 ， 在 旋转 中 被 改 变 的 仅 是 指针 ， 而 节点 中 其 他 域 则 保持 不 变 。 
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He 
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图 143 过 程 LEFT-ROTATE(CT， 修改 _ 棵 二 又 查找 树 的 例子 


14.3 插 人 


同一 棵 含 个 节点 的 红 - 黑 侍 中 揪 和 人 一 个 新 节点 的 操作 可 在 OUlg on) 时 间 内 完成 ， 插 人 过 
和 存 是 这 样 的 : 多 调用 TREE-INSERT 过 程 见 (13.3 节 ) 将 节点 x 揪 人 树 T， 就 好 像 工 是 棵 普 
通 的 二 又 查找 树 一 样 ， 然 后 将 X 着 为 红色 。 为 保证 红 -- 黑 性 质 能 继续 保持 ， 和 再 对 有 关节 点 重 
新 着 色 并 旋转 。RB-INSERT 过 程 的 大 部 分 代码 都 是 处 瑞 这 个 过 程 中 可 能 出 现 的 各 种 情 
况 . 
RHB-INSERTIT,x) 
1 _ TREE-INSERTCT, 


2 color[xh 一 RED 
3 While xx#root[T] and coiorfpfxh= RED 


4 ”doifp[x=leftp[p[x]l] 

5 then y“ -mght[prp[xl] 

折 这 color[ 沾 = RED 

7 then colorfpfxj< 一 BLACK 入 情况 
8 coior [y]<- BLACK 人 情况 
纺 colafr[pip[x 由 <-RED 放 博 况 汪 
10 XpP[Pf 上 情况 1 
1 else 证 xx 一 TiEht[pxi 

12 then  xX<-pfx] - 全 情 癌 2 
13 LEFT--ROTATEIT.x) . 人 情况 2 
]14 color[PExHe-BLAC 氏 入 情况 3 
15 ColotrIhp[x 四 < 及 EDP 入 情况 3 
16 RIGHT-ROTATE(CTp[p[fx) 从 情况 3 


17 elset 同 then 子 铝 , 上 是 开 换 right 和 2*ieftey 
18 color [root[ 了 -BLACK 

我 们 将 分 三 个 主要 步 要 来 对 上 上 面 的 代码 进行 分 析 。 首 先 ， 先 确定 在 第 1--2 行 中 捅 人 节 
点 X 并 将 其 着 为 红色 后 ， 红 -- 暴 性 质 中 有 哪些 木 能 继续 保持 。 其 次 ， 对 第 3-17 行 中 while 循 
坏 的 总 目标 加 以 分 析 。 最 后 ， 具 体 分 析 while 循 坏 的 演 种 情况 ， 看 看 它们 是 如 何 完成 循环 部 
分 的 目标 的 。 图 14.4 示 出 了 RB-INSERT 作用 过 程 的 一 个 例子 , (g) 在 插 人 后 的 一 个 节点 
x。 因 为 x 及 其 父 节点 p[x] 都 是 红 的 ， 酸 违反 了 性 质 3， 又 因为 x 的 概 父 节点 是 红 的 ， 则 
可 应 用 代码 中 的 情况 1。 各 节点 被 重新 着 色 ， 指 针 x 洛 树 上 升 ， 所 得 的 树 如 (by 中 所 示 。 这 样 
一 来 ，X 及 其 父 节 点 又 都 为 红色 ， 但 工 的 叔父 节点 Y 是 黑 的 。 由 于 x 为 pfxj 的 右 孩 子 ， 故 可 
垃 用 情况 2。 在 执行 一 次 左旋 之 后 ， 所 得 结果 树 见 (c)。 现 在 x 是 其 父 节点 的 左 孩 子 ， 则 可 应 
用 稍 况 3。. 执行 一 次 右 旋 后 得 (d) 中 的 树 ， 它 是 -一 棵 合法 的 红 - 黑 树 ， 

在 上 面 代码 的 第 1--2 行 后 ， 红 -- 峙 性 质 中 的 哪 -一 些 可 能 被 玻 坏 ? 性 质 1 和 性 质 2 恋 续 成 
艾 ， 因 为 新 插 人 的 节点 的 子女 都 为 NIL。 性 质 4 也 继续 成 立 ， 因 为 x 赫 换 了 一 个 空 节点 
NIHL， 而 x 本 身 是 具有 子女 NIL 的 红 节 点 。 这 样 ， 唯 一 可 能 被 破坏 的 就 是 性 质 3. 性 质 3 是 
说 一 个 红 节点 不 能 有 一 个 红 的 子 节 点 。 具 体 来 说 ， 如 果 x 的 父 节点 是 红色 的 ， 则 性 质 3 被 破 
坏 ， 因 为 x 在 第 2 行 中 被 标 为 红色 的 。 图 14.4( 四 中 给 出 了 一 个 例子 。 
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第 3-17 行 中 while 循环 的 作用 是 将 对 性 质 3 的 破坏 作用 沿 树 上 移 并 使 性 质 4 保持 不 
变 ， 在 每 次 握 环 开始 处 x 指向 一 个 具有 红色 父 节 点 的 红色 节点 ， 邵 树 中 对 红 - 黑 性 质 有 所 厂 ， 
坏 的 唯一 之 处 。 每 次 循环 的 结果 有 两 种 可 能 : 指针 x 沿 树 上 升 ， 或 做 旋转 并 结束 循环 。 


【 直 


{b)》 


人] 


【 山 





贺 14.4 继 B--INSERT 的 操作 过 程 


实际 上 ， 在 while 循环 中 要 考虑 六 种 情况 ， 但 其 中 有 三 种 傅 况 与 另外 三 种 是 亚 相 对 称 
的 。 这 种 对 称 要 取决 于 x 的 父亲 p[x] 是 x 的 祖父 plp[x 纪 的 左 孩子 还 是 右 孩 子 、 如 第 4 行 中 痢 
定 的 那样 。 代 码 中 我 们 只 处 理 了 pfx] 是 p[p[xji 的 左 孩 子 的 情况 。 另 外 ， 我 们 还 做 了 一 个 重要 
假设 ， 即 假设 根 是 黑 的 ， 以 保证 p[x] 不 是 根 节点 ， 从 而 pfpfxl 总 是 存在 ， 

情况 "1 与 情况 2 和 3 的 区 别 在 于 x 的 父亲 的 兄弟 ( 误 叔 权 ) 的 颜色 有 所 不 同 。 第 5 行使 y 
指向 x 的 示 叔 right[pfp[x]， 并 在 第 6 行 中 测试 其 颜色 。 如 果 y 是 红 的 ， 则 执行 情况 1。 否 
则 ， 控 制 就 传 到 情况 2 和 情况 3 上 。 在 所 有 三 种 情况 中 ，x 的 祖先 p[p[x] 是 黑 的 ， 因 为 x 的 
父亲 是 红 的 ， 故 性 质 3 只 在 x 和 p[x] 之 间 被 破坏 了 . 站 

情况 站 的 处 理 过 程 (第 ?-10 行 ) 如 图 14.5 所 基 。 性 质 3 被 违反 了 ， 因 为 xx 及 其 父 节 点 
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p[x] 郝 是 红 的 。 无 论 (a) x 是 个 右 孩 子 ， 或 (bj x 是 个 左 和 孩子 ， 都 要 采取 相同 的 操作 。 子 
树 x，8，7，5 和 s 中 的 每 一 棵 都 有 个 黑 根 ， 且 黑 离 度 都 相同。 情况 1 的 代码 要 改变 某 些 节 ， 
点 的 颜色 ， 从 测 保 持 性 质 4: 所 有 的 从 某 一 节点 至 一 叶子 的 向 证 路 径 都 有 相间 的 黑色 数 ， 
while 特 环 以 节 上 总 x 的 祖父 节点 p[p[x 作 为 新 的 x 而 继续 迭代 、 这 样 ， 任 何 对 性 质 3 的 违反 
只 可 能 出 现 于 新 x 《为 丝 色 ) 与 其 父 节点 〔 如 果 它 也 是 红色 的 话 )。 当 p[xl 和 y 都 是 红色 树 
时 才 执 行情 况 1。 因 为 plpfx 是 黑色 的 ， 我 们 可 以 将 pfxj 和 都 着 为 黑 包 的 (这 样 就 解决 了 x 
和 p[z] 都 是 红色 的 问题 )， 将 Flp[xjl 着 为 红色 ， 从 侧 保 持 了 性 质 4。 唯 一 可 能 出 现 的 问题 是 
pfpfx]j 的 父 节 点 可 能 是 红色 的 。 困 此 ， 我 们 还 要 以 p[pfpx 作 为 新 节点 x 来 重复 while 循环 。 





图 14.5 过 程 RB-TNSERT 的 情 襄 1 


在 情况 2 和 3 中 ，x 的 坡 叔 y 是 黑色 的 。 这 两 种 情况 是 通过 x 是 p[x] 的 左 孩 子 还 是 右 孩 
于 而 相 区 别 的 。 第 12~13 行 构成 了 情况 2， 如 图 14.6 所 示 。 如 在 情 沈 1 中 一 样 ， 性 质 3 在 
情况 2 和 情况 3 中 都 被 违反 了 ， 因 为 x 及 其 父 节点 bfbx] 都 是 红色 的 。 子 树 wx，B，? 和 5 中 的 
每 一 棵 都 有 一 个 贞 根 。 且 具有 相同 的 黑 高 度 。 通 过 一 次 左旋 可 将 情况 2 转换 成 情况 3， 从 而 
保持 了 性 质 4: 从 某 一 节点 至 一 叶 节 点 的 所 有 向 下 路 径 都 有 相同 的 黑色 数 。 情 况 3 引起 某 些 
”节点 颜色 的 改变 及 一 次 右 旋 ， 同 样 也 保持 了 性 质 4。 然 后 while 循环 终止 ， 因 为 性 质 3 得 到 
了 满足 : 已 不 会 有 连续 商 个 红色 节点 。 寻 情况 2 中 、 节 点 x 是 其 父 新 的 右 和 孩子 。 我 们 可 以 进 
行 .- 次 左旋 而 将 其 变换 到 情况 3( 第 14-16 行 )， 这 时 x 是 其 父 节点 的 左 菠 子 。 因 为 x 和 p[x] 
是 红 的 ， 所 做 的 旋转 对 节点 的 黑 高 度 和 性 质 4 都 无 影响 。 无 论 是 直接 地 或 间 地 (通过 情况 信 
进入 情况 3，x 的 叔 扳 y 总 是 墨色 的 ， 因 为 否则 的 话 我 们 就 应 该 执行 情况 1 在 情况 3 中 ， 
要 改变 某 些 节 点 的 颜色 ， 并 做 一 次 右 旋 以 保持 性 质 4。 这 样 ， 不 再 有 两 个 连续 的 红色 节点 ， 
所 有 的 处 理 到 此 完毕 。 注 意 ， 因 为 这 时 px] 是 黑色 的 ， 所 以 无 需 再 执行 -- 次 while 循环 。 
RB-INSERT 的 运行 时 间 所 样 呢 ? .会 唱 个 节点 的 红 一 黑 树 的 高 度 为 Dtg m) 因 而 调用 
TREE-INSERT 要 花 Dllig oj 时 间 ， 仅 当 情 况 1 被 执行 时 ，while 循环 才 会 重复 ， 目 指针 x 
沿 钢 上 升 。 这 样 ，while 循环 可 能 被 执行 的 总 次 数 就 为 Dfig m。 所 以 ，RB-INSERT 的 总 村 
间 就 为 Qug 由 。 有 趣 的 是 ， 该 过 程 所 做 的 旋转 从 不 超过 二 次 ， 因 为 只 要 执行 了 情况 2 或 情 
况 3 后 while 循环 就 结束 了 。 
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图 14 硬 ”让 程 RB 一 TSERT 的 情 六 2 和 情况 3 


14.4 删除 


和 红 -- 黑 树 上 的 其 他 基本 操作 一 样 ， 对 一 个 节点 的 删除 操作 要 花 OUg np) 的 时 间 。 与 揪 人 
操作 相 比 ， 删 除 操作 兵 是 石 微 复兴 些 ， 
为 简化 代码 中 的 边界 条 件 ， 我 们 采用 一 个 哨兵 元 素来 表示 NIL。 对 -一 样 红 - 黑 树 T， 哨 
兵 nilfTI 是 一 个 有 着 和 树 中 其 他 节点 相同 的 各 域 的 对 象 。 其 颜色 为 BLACK， 而 另 一 些 域 
人 Pjeftright 和 key 等 ) 则 育 被 置 成 任意 允许 的 值 。 这 样 红 - 黑 色 树 中 的 所 有 NIL 指针 媳 蔡 换 
成 指 册 哨兵 nil[ 了 的 指针 。 
采用 了 哨兵 后 ， 我 们 就 可 将 某 节 点 xx 的 NIL 防 子 当 作 x 的 一 个 普通 的 孩 节 来 处 理 。 我 
们 固然 可 出 不 同 的 哨兵 节点 来 替换 检 中 的 每 个 NIL， 人 和 使 每 个 NE 的 父 节 点 都 是 良 定 义 的 ， 
但 这 样 比较 浪 览 空间 。 央 此 ， 我 们 用 一 个 哨兵 nilfT] 来 代替 所 有 的 NIL。 竺 当 要 操 级 背 避 天 
的 基 个 著 子 时 ， 要 上 先 将 pfniifT 稚 侣 为 X。 
通过 对 第 133 节 中 的 过 程 TREE-DELETE 略 作 些 修 改 就 可 得 到 下 面 的 
RB-DELETE。 在 删除 一 个 节点 后 ， 该 过 程 就 调用 一 个 辅助 过 程 RB-PELETE-FIXUP 来 
改变 革 些 节点 的 颜色 , 并 做 必要 的 旋转 ， 从 而 保持 红 一 黑 性 质 。 
录 B-DELETE(T.z) 
1 这 eft[ 可 一 mi[T] or eght[z] 一 ni 可 
之 then ys-EZ 
3 elise y-TREE-SUCCESSOR(z) 
4 让 leitiyaitlT] L 
对 theil Xe- 1etty 
6 else XeaTigbdy] 
7 ptxT< 一 py 
8 计 py=ailT 
， then root[T]~ 
10 else 让 y= 二 ftipIyl 


11 then 论 访 [中 [下 < 一 x 

12 else  htrpfy 了 < 一 x 

13 让 3ez 

14 then keytz-_ikeytyj 

15 从 如 果 还 有 其 他 域 , 也 加 忆 复 制 


]6 诺 ecoleof 史 = BAC 基 
7 记 en RB-DEILETE 一 FIXLREMTx) 
1 8 FeEtarm 了 
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过 程 TREE-DELETE 与 RB-DELETE 之 间 有 三 点 不 同 。 首 先 ，TREE-DELETE 中 
所 有 对 NIL 的 引用 在 RB-DELETE 中 都 被 替换 成 对 哨兵 nil[ 了 的 引用 。 其次， 
TREE-DELRTE 的 第 ? 行 中 判断 x 是 否 为 NIL 的 测试 被 去 掉 了 ， 取 而 代 之 的 是 RB-DE- 
LETE 的 第 ?7 行 中 无 条 件 地 执行 赋值 pP[xlj<-p[yl]。 这 样 ， 如 果 x 是 哨兵 miT]j， 其 父 指 针 就 指 
朵 被 删除 的 节点 y 的 父亲 。 第 三 ， 在 第 16-17 行 如 果 yy 是 黑色 的 ， 则 调用 
RB-DELETE-FIXUP。 如 果 y 是 红色 的 ， 则 当 y 被 删除 后 ， 红 -- 黑 性 质 仍 然 保 持 ， 因 为 树 
中 各 节点 的 黑 高 度 都 没 变化 ， 也 不 存在 两 个 相 邻 的 红色 节点 。 在 y 被 删除 前 ， 如 果 y 有 个 非 
NIL 护 子 ， 则 传 给 RB-DELETE-FIXUP 的 节点 x 必 为 了 的 唯一 孩子 ; 如 果 y 没有 孩子 ， 
则 xx 必 为 哨兵 mTT。 在 后 一 种 情况 中 ， 第 了 7 行 中 的 无 条 件 赋 值 保证 x 现在 的 父 节 点 为 先前 
y 的 父 节 点 ， 无 论 x 是 内 节点 或 哨兵 nil[T]. 

下 面 可 以 来 看 看 过 程 RB-DELETE-FIXUP 是 如 何 焦 复 红 一 昧 性 质 的 。 

RSB-DELETE-FIXUEP(T,x) 


1】 while x= 冯 root[T] anad colorxj= 至 LAC 天 
2 do 评 x 一 Left[p[xjj 


3 then 克 <-TiEhtftx]] 
直 ifcolotwl=RED - 
$ then colorw]*-BILACK 情况 1 
6 Colorfp[x]]- 一 及 三品 ”办 情 况 1 
7 LEFT-ROTATE(T.pfx 人 太 情 况 1 
8 w< -rightptxj 六 情况 1 
， 于 eolor[left[wjj== 3LAA 人 了 and color[right[wl= BLACK 
10 then colorfwj-RED 办 情况 2 
11! xb] 人 情况 2 
12 -| else 让 colorrightpwj 王 BLACK 
13 tben eolor[leftFwjl- -BEL 和 CC 收 六 情 损 2 
14 color[w]< 一 良 D . 
15 RIGHT-ROTATE(CT,w) 入 情况 3 
1] we -Tight[p[x]] 入 情况 3 
17 Colordwjcolorfp[x]] 入 情况 4 
] 各 colorp[x]--BLACK 信 悄 况 4 
19 、 colorfnaght[w]]<-BLACK 六 情况 4 
20 LEFT-ROTATE(T,p[xD) 八 情 况 4 
21 x< roafT] 大 情况 4 
22 else( 问 then 子 句 , 只 是 玉 换 “gbt 记 和 ”left 


23 eolor[x|-BILAC 扩 


在 及 B-DELETE 中 ， 如 果 被 删除 的 节点 y 是 黑色 的 ， 则 所 有 原先 包含 y 的 路 径 在 y 被 
删除 后 都 少 了 一 个 黑 节点 。 这 样 ， 性 质 4 就 被 破坏 了 。 补 救 这 个 问题 的 一 个 办 法 就 是 把 x 视 
为 还 有 额外 的 一 重 黑 色 ， 亦 即 ， 如 果 我 们 将 任意 包含 节点 x 的 路 径 上 黑 节点 个 数 加 14， 则 在 
这 种 解释 下 ， 性 质 4 就 成 立 。 当 我 们 将 黑 节点 y 删除 时 ， 我 们 将 其 黑色 “下 推 " 至 其 子 节点 。 
仪 有 的 一 全 问题 是 现在 节点 天 可 能 是 “双重 黑色 ”的 了 ， 从 而 就 要 厂 坏 性 质 1， 

RB-PDPELETE-FIXUP 过 程 试 图 恢复 性 质 1。 第 1-22 行 中 while 循环 的 目标 是 将 额外 
的 黑色 沿 树 上 移 ， 直 到 (bx 指向 一 个 红 节点 ， 在 这 种 情 癌 中 我 们 在 第 23 行 里 将 该 节点 标 为 
里 色 的 ; (2jx 指向 根 ， 这 时 可 消除 那个 额外 的 黑色 ; 人) 做 必要 的 颜色 修改 和 旋转 。 
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在 while 循环 中 ，x 总 是 指 问 具有 额 外 扶 色 的 那个 非 根 节点 。 在 第 2 行 中 要 判断 x 是 其 
父亲 pfx] 的 左 孩 子 或 是 右 孩 子 (我 们 给 出 了 x 为 在 态 子 时 的 找 码 ; X 为 右 接 了 时 的 情况 是 对 称 
的 }。 对 x 的 兄弟 ， 我 们 用 一 指针 w 加 以 记录 。 关 为 x 是 双重 黑色 的 ， 故 w 不 能 是 nilfT]; 
和 否则， 从 pt 至 NIL 叶 节点 更 揭 路 径 上 的 黑 节 点 数 就 会 小 于 从 p[g] 至 x 的 路 径 上 的 黑 季 点 
数 ， 


【By) 


tb) 


tC) 


(9 





质 14.7 过 程 黎 -PELETE 中 while 循 环 的 备 种 情况 


算法 中 药 四 种 情况 在 图 14.7 中 加 以 了 说 明 。 加 黑 的 节点 是 黑色 的 ， 加 了 重 阴 影 的 节点 
是 红色 的 ， 加 了 浅 阴 影 的 节点 〈 可 能 是 红 的 ， 也 可 能 是 黑 的 ) 用 c 与 c”′ 表 未。 字母 wx，P， 
…， 志 表 示 任 意 的 子 树 。 在 每 种 情况 中 ， 通 过 改变 基 些 节点 的 颜色 及 《或 ) 执行 一 次 旋转 可 
将 左边 的 构 形 转化 为 有 过 的 樟 形 。 让 x 指 向 的 节点 具有 牢 外 的 -- 居 黑色 。 寺 起 循环 重复 的 叭 
一 一 种 情况 即 情况 2，(aj 通过 交换 节点 B 和 了 的 色 以 及 执行 一 次 左旋 可 将 情况 1 转化 
为 情况 2，3 或 4。 (b) 在 捕 况 2 中 ， 册 指针 xX 所 表示 的 额外 黑色 在 将 节点 D 着 为 红色 , 将 Xx 
置 为 指 疝 节点 B 后 可 洁 树 大 升 。 如 果 我 们 是 通过 情况 上 进入 情况 2 的 ， 岗 while 循环 结束 ， 
因为 蔬 色 C 为 红色 。 (c) 通过 交换 节点 C 和 D 的 赢 色 并 执行 一 次 右 旋 可 将 情况 3 转换 成 情 
癌 4。(d) 在 情况 4 种、 通过 改变 革 些 节点 的 颜色 并 执行 一 次 左旋 (不 违反 红 一 黑 性 质 ) 可 


-一 187- 一 


将 由 x 表示 的 额外 黑色 去 挤 ，. 从 而 循环 结束 。 在 具体 研究 每 一 种 情况 之 前 ， 我 们 先 一 般 地 看 
看 每 种 情况 中 的 变换 是 如 保持 性 质 4 的 。 要 把 拖 的 关键 思想 就 是 每 种 情况 中 ， 图 中 示 出 的 予 
例 的 根 到 每 棵 子 树 xz，p8，…，“ 上 之 间 的 黑 节 点 数 并 不 被 变 换 所 改变 。 例 如 ， 图 14.7(a) 说 明 
了 情况 1， 其 中 根 至 任 一 子 树 x， 或 让 之 同 的 黑 节 点 都 是 3， 这 在 变换 前 后 是 一 样 的 ( 记 住 ， 
指针 x 增加 了 额外 的 一 重 黑色 )， 类 但 地 ， 在 变换 前 后 桂子 树 ?，6 “和 上 中 的 尾 一 者 之 
闻 的 黑 节点 都 是 2。 在 图 14.7(b) 中 ， 计 数 时 还 要 包括 c。 它 或 是 红色 ， 或 是 黑色 。 旭 果 我 们 
定义 cotint(REPDD)=0 以 及 count(BLACK)= 一 1， 则 根 革 wx 的 黑 节点 数 为 2Hcountftci 恋 搞 前 - 
后 都 -* 样 )。 其 他 情况 可 类 伏地 加 以 验证 {( 见 练习 14.4 一 5)， 

情况 1{( 厚 RB-DELETE 的 第 5-8 行 和 图 14.7(a) 当 节点 x 的 姑 弟 w 为 红色 时 发 生 。 因 
为 W 必须 有 黑色 孩子 ， 我 们 可 以 改变 mw 和 PIg 颜 色 ， 再 对 PI 轩 做 一 侈 左旋 ， 红 - 黑 性 质 也 能 
继续 保 持 。 现 在 ，x 的 新 兄弟 为 原先 w 的 某 个 孩 了 ， 其 颜色 为 黑色 。 这 样 ， 我 们 就 将 情况 ; 
转换 到 了 情况 2，3 或 4。 

当 节 点 为 黑色 时 情况 23 和 4 发 生 ; 可 以 根据 w 的 手 节 点 的 颜色 对 它们 加 以 区 分 。 在 情 
说 2RB-DELETE-EFIXUP 的 第 10-11 行 和 图 14.7(b)) 中 ，w 的 两 个 孩子 都 是 村 色 的 。 因 
为 ww 也 是 黑色 的 、 故 我 们 从 x 和 w 上 去 掉 一 重 黑 色 ， 便 得 X 只 有 一 重 黑色 ， 而 w 则 为 红 
色 ， 青 向 p 中 上 加 上 一 重 额外 的 黑色 : 然后 ， 以 PLD] 为 新 节点 和 重复 while 循环 。 注 意 如 果 
我 个 通过 情况 1 进 人 情况 2， 则 新 节点 x 是 红色 的 ， 因 为 原来 的 px 是 红色 的 ， 故 在 测试 循 
环 条 件 后 循环 结束 。 

情况 3 第 13-16 行 和 图 14.7(ch 在 w 为 黑色 ， 且 其 左 孩 子 为 红色 ， 右 孩子 为 黑色 时 发 
生 。 我 们 可 以 改 变 到 和 其 左 护 子 leftfw] 的 颜色 并 对 w 进行 右 旋 ， 而 红 -- 黑 性 质 仍 然 保持 。 现 
在 x 的 新 的 兄弟 w 是 个 黑 节 点 ， 其 右 和 孩子 为 黑色 。 这 样 ， 我 们 就 情况 3 转换 了 情 癌 4。. 

情况 4( 第 7-21 行 和 图 14.7(a]) 当 节点 xx 的 吕 弟 w 为 黑色 且 w 的 右 孩 子 为 红色 时 发 生 。 
通过 作 某 些 颜色 修改 并 对 p[x] 做 一 次 左旋 ， 我 们 可 以 不 破坏 红 - 黑 性 质地 去 掉 x 的 额外 黑 
色 . 将 x 置 为 根 后 ， 当 while 循环 进行 了 测试 后 恒 结 束 。 

RB-DELETE 的 运行 时 间 怎 样 呢 ? 含 刁 个 节点 的 红 - 黑 树 的 商 度 为 DUlg 由 ， 不 调用 
RB--DELETE-FIXUP 时 该 过 程 的 总 代价 为 Dtlg 站， 在 RB-DELETE-FIXUP 中 ， 人 情况 
IE，3 和 4 在 各 执行 一 定 次 教 的 颜色 修改 和 至 多 三 次 旋转 后 便 结 束 。 情 部 2 是 while 循环 可 被 
重复 的 肉 一 情况， 其 中 指针 x 沿 树 上 升 的 次 数 至 多 为 OUg 种 次 ， 且 不 执行 任何 旋转 。 这 
样 ， 过 程 RB-PDELETE-FIXUP 要 花 如 (lg nm) 时 间 ， 做 至 多 :三 旋 转 ， 从 而 及 B-DELETE 
的 总 时 间 为 OUg 中。 


14-t 持久 动态 集合 


在 一 个 算法 中 ， 有 时 在 对 一 个 动态 集合 修改 时 有 必要 保留 其 过 去 的 版 本 。 这 样 的 集合 被 
称 为 是 持久 的 。 实 现 持久 集合 的 一 种 方法 是 每 当 该 集合 被 修改 时 就 将 其 整个 地 复制 下 来 。 这 
个 方法 会 降低 一 个 程序 的 执行 速度 ， 且 占用 了 过 才 的 空间 。 有 时 候 ， 可 以 找到 一 些 更 好 的 办 
法 。 
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如 图 14.8 所 示 ，(a) 包含 关键 字 2，3，4，7，8，10 的 -- 棵 二 叉 查 找 树 。({b)] 树 和 关 
键 字 5 后 的 持久 二 叉 查找 树 。 该 集合 的 最 新 版 本 包括 由 根 r” 出 发 可 达 的 节点 ， 其 前 一 个 版 
本 包 合 由 根 + 可 达 的 节点 。 当 关键 字 $ 被 插 人 时 就 雯 加 那 些 重 阴 影 的 节点 。 我 们 用 二 又 查找 
树 来 实现 一 个 持久 和 集合， 有 关 的 操作 有 INSERT，DELETE 和 SEARCH。 对 集合 的 每 一 
个 版 本 我 们 都 给 出 一 个 根 。 为 把 关键 字 5 插 人 到 集合 中 去 ， 就 要 创建 一 个 具有 关键 字 5 的 新 
节点 。 该 节点 被 创建 后 就 成 为 具有 关键 字 7 的 新 节点 的 左 孩 子 。 类 似 地 ， 具 有 关键 字 7 的 节 
点 成 为 具有 关键 字 8 的 新 节点 的 左 孩 子 ， 后 者 的 右 孩 子 为 既 存 的 具有 关键 字 10 的 节点 。 关 
键 字 为 8 的 节点 又 成 为 关键 字 为 4 的 新 根 的 右 孩 子 ; 的 左 孩子 是 关键 字 为 3 的 节点 。 这 
样 ， 我 们 只 是 复制 了 树 的 一 部 份 ， 新 树 和 老 树 之 间 有 一 些 共 同 节点 。 如 图 14.8(b) 所 示 。 





-图 14.8 持久 动态 集合 


a. 对 一 标 一 般 的 持久 二 叉 查 找 树 ， 确 定 为 插 人 -一 个 关键 字 k 或 删除 一 个 节点 了 时 需要 
改变 的 那些 节 战 。 

b. 请 写 出 一 个 过 程 PERSISTENT-TREE-INSERT， 使 得 在 给 定 一 棵 持久 峙 工 各 一 个 
要 揪 太 的 关键 字 时 ， 它 返回 将 让 揪 人 T 后 新 的 持久 树 T。 假 恋人 每 个 树 节 点 包含 城 key，1eft 
和 Figbt 和 参见 练 本 14.3 一 全 。 

c. 如 果 持 久 二 叉 查 找 树 了 T 的 高 度 为 h， 所 实现 的 PERSISTENT--TREE-TNSERT 的 时 
空 要 求 怎 样 ? (空间 要 求 与 新 分 配 的 英 点 数 成 正比 ) 

d. 假设 我 们 在 每 个 节点 中 增加 一 个 父亲 节点 域 。 这 样 -- 来 ，PERSISTENT- TREE 一 
INSERT 要 就 做 一 些 额外 的 复制 工作 。 证 明 在 这 种 情况 下 ， 该 过 程 的 时 空 要 求 为 fn)， 其 
中 为 树 中 的 节点 数 。 

e. 说 明 如 何 利用 红 - 黑 树 来 保证 每 次 播 人 或 如 除 的 最 证 情况 运行 时 间 为 ou mn 


14-2 红 一 果树 上 的 连接 操作 


连接 (ioin) 操 作 以 两 个 动态 集合 S 和 S。 和 一 个 元 素 x 为 参数 ， 使 对 任何 xi SixaK S:， 
有 keyfx 和 keyfxj<key[xa]， 该 操作 返回 一 个 集合 S=Sil fx LUiS:。 在 这 个 问题 中 ， 我 们 来 
讨论 如 何在 红 -- 黑 树 上 实现 连接 操作 

a. 给 定 一 棵 红 -- 黑 树 T， 其 黑 高 诬 被 存放 在 域 bhfT] 中 。 论 证 : 在 不 需要 树 中 额外 存 信 
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和 不 增加 渐 近 运行 时 间 的 前 担 下， 可 用 RB-INSERT 和 和 有 B-DELERTE 来 维护 这 个 域 。 证 
明 : 当 源 工 下 降 时 ， 可 对 每 个 被 访问 的 节点 在 DO 人 GD 时 间 内 确定 其 黑 商 度 。 ， 
我 们 希望 实现 操作 RB-JOINCTD，xTa)， 它 破坏 TI 和 T2 并 返 问 一 棵 红 -- 黑 树 工 一 Ti 
fx 作 JT。 设 nm 为 T 和 T 中 的 总 节点 数 。 
b. 不 失 一 般 性 ， 假设 bhfTi] 关 bhiTzj。 请 描述 一 个 DIlg m 时 间 的 算法 。 使 之 能 在 T 中 
从 黑 融 度 为 bhfT2 的 节点 中 选 出 具有 最 大 关键 字 的 黑 节点 y。 


里 用 Ttx 儿 IT: 来 取代 Ty。 

d. 划 保 持 红 - 黑 性 质 1，2 和 4， 应 将 x 看 为 什么 颜色 ? 说 明 如 何 能 在 OUlg on) 时 间 里 恢 
复 性 质 3。 

e. 论证 : 妇 B-JOIN 的 运行 时 间 为 OUg nj， 


练习 十 四 


14.1-1 画 出 在 关键 字 集 人 台 !11，2，…，1 引 上 商 庶 为 了 的 完全 二 又 查 找 树 。 以 三 种 不 同方 式 向 树 中 加 
人 NIL 时 节点 .并 对 各 节点 着 色 ， 使 记得 的 红 - 黑 树 的 黑 疝 诬 分 别 为 2，3， 和 利生 。 

14. 上 2 条 民 一 哥 红 一 黑 树 的 根 为 红 的 。 如 果 糙 它 变 为 蛙 的 ,这 棵 树 是 否 还 是 一 棵 红 - 黑 树 ? 

14.14-3 证 骨 : 在 一 棵 红 - 黑 森 中 ， 从 某 节 点 x 至 其 后 代 时 市 点 的 所 有 简单 路 区 中， 最 长 的 一 条 至 密 是 
报 所 一 条 的 两 禾 。 

14.1-4 ,在 一 棵 黑 请 度 为 下 的 红 - 晤 树 中 ， 内 节点 的 最 大 可 能 个 数 是 多 少 ? 最 少 可 能 是 多 少 ? 

14.1-5 ”请 描述 山 一 棵 nm 个 关键 宝 上 的 红 -- 黑 竺 ， 使 其 中 红 的 内 节点 数 与 黑 的 内 节点 数 的 比 全 最 大 。 这 
全 比值 是 客 少 ? 引 有 最 小 可 能 的 比例 的 树 允 是 怎样 ? 出 值 是 多 录 ? 


14.2 一 1 对 阁 14.1 中 的 引 - 轧 树 调 用 TREE-INSERT 插 人 关键 字 36 后 ， 站 果 怎 样 ?如果 择 人 的 节点 
被 标 为 红色 、 所 得 的 树 基 和 否 还 是 一 棵 红 一 黑 树 ? 如 毕 该 节点 困 为 黑色 电 ? 

14.2-2 写 出 有 RIGHT-RCGTATE 的 坊 代 友 . 

14.2-3 论证 旋转 襟 作 能 保持 二 艾 树 中 关键 字 的 中 强 次 序 。 

14.2 一 4 证 在 图 14.2 的 志 迎 一 棵 树 中 ，asb 和 < 分 别 为 子 树 we， 有 和 ?中 的 任意 节点 。 如 果 将 节点 蒜 瑟 
旋 ， 则 ab 得 < 的 深 册 会 如 何 变化 ? 

4.2-5 证 明 : 任意 一 棵 含 n 个 节点 的 树 可 通过 CQm) 次 旋转 变 为 另 一 标 含 nm 个 节点 的 树 。 

过 

14.3-1] 在 RB-INSERT 的 第 2 行 中 ， 我 们 将 新 插 人 的 节点 X 着 为 和 红色。 如 对 我 们 将 x 着 为 黑色 ， 则 
红 - 照 树 的 性 质 3 就 不 会 被 改 栖 。 那 么 ， 我 们 不 将 x 喷 为 黑色 昵 ? 

14.3--2 在 RB-INSERT 的 第 18 行 中 ， 根 节点 被 置 为 黑色 , 这 样 佑 有 秆 么 好 处 ? 

14.3-3 在 将 关键 字 41,38.31,12.19,8 搬 人 一 棵 初始 为 空 的 红 一 于 树 中 ， 结 果 怎 样 ? 

14.3-4 要 设 财 14.5 和 图 14.6 中 子 树 mw，8，y，6，8 的 黑 识 度 者 为 。 请 标 上 各 个 结 点 的 黑 高 庶 ， 并 
性 让 岗 中 所 砂 的 各 种 转换 能 保持 性 质 4. 

14.3-5 者 虚 计 妈 B-TNSERT 搬 人 mm 个 节点 而 成 的 一 棵 红 一 黑 树 。 论 证 : 如 果 mn> 1， 则 庐 树 至 少 有 一 
地 红 节点 ， 

14.3-6 说 明 如 果 红 一 黑 树 的 袁 示 中 不 提供 父 指针 ， 则 典当 如 全 有 效 地 实现 RSB-INSERT? 


14.4-1 论证 : 在 执行 尺 B-DELETE 后 ， 红 -- 黑 树 的 根 总 是 所 色 的 . 
14.4-2 在 练习 14.3-3 里 ， 我 们 将 关键 字 41,.38,31.12,19.8 连续 捅 人 一 棵 初始 为 空 的 树 中 ， 从 而 得 到 一 


樟 红 -- 黑 树 。 请 给 册 从 该 树 中 连续 期 除 关键 字 8&.12,19,31.38.41 后 的 结果 . 


14.4-3 在 RB-DELETE-FIXUP 的 群 一行 中 我 们 可 能 会 检查 或 修改 哨兵 mil[Tl? 


14.4-4 通过 利用 一 个 哨兵 代替 NIL, 另 一 个 哨兵 存放 指向 根 的 指针 来 简化 LEFT_ROTATE 代码 。 
14.4-5 在 图 14.7 的 每 种 情 襄 中 ， 给 出 所 孙子 树 的 根 至 子 树 w， 局 


…， 5 之 间 欧 思 节 点 个 数 ， 并 验证 
它们 在 变换 后 保持 不 变 。 当 一 个 节点 的 颜色 为 c 或 时， 在 计数 中 可 用 记号 countkej 或 countc) 来 表示 。， 
14.4-6 叙 设 用 RB-INSERT 将 一 节点 x 播 入 一 棵 红 - 插 树 ， 紧 接着 又 将 它 从 树 中 删除 。 结 果 的 树 与 
初始 的 树 是 否 相 同 ? 
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第 十 五 章 ”数据 结构 的 扩张 


有 些 工程 性 的 应 用 中 ， 擅 希 的 只 是 一 些 标准 的 数据 结构 ， 如 汶 链 表 、 杂 次 表 或 一 又 查找 
树 等 ; 同时 ， 也 有 许多 应 用 要 求 在 现 有 数据 结构 上 有 所 创新 ， 但 很 少 需要 创造 出 全 新 的 数据 
结构 。 和 通常 情况 下 ， 只 要 和 疝 标 准 的 数据 结构 中 增加 -- 些 信息 即 可 。 但 是 ， 数 据 结 梅 的 扩张 并 
不 总 是 这 人 么 直接 了 当 的 ， 因 为 附加 的 信息 还 要 能 为 该 数据 结构 上 普通 的 操作 所 更 新 和 维护 . 

这 一 章 讨 论 商 种 通过 增 广 红 - 咎 树 和 而 构造 出 来 的 数据 结构 。15.1 节 介 绍 一 种 支持 一 般 的 
动态 集合 上 顺 冯 统计 操作 的 数据 结构 。 有 了 这 种 结构 ， 我 们 就 可 饼 速 找到 一 个 集合 中 的 第 i 
个 最 小 的 元 素 ， 或 给 出 某 个 元 素 在 集合 的 线性 序 中 的 位 置 。15.2 节 对 数据 结 梅 的 扩张 过 程 
进行 了 抽象 ， 并 提供 一 个 定理 来 简化 对 红 - 黑 树 的 扩张 。15.3 节 利 青 这 个 定 册 米 设计 一 种 用 
于 维护 由 ( 时 间 ) 区 问 而 构成 的 动态 集合 的 数据 结 


15.1 动态 顺序 统 计 


第 十 章 中 介绍 了 顺序 统计 的 概念 。 例 站 ， 含 nm 个 元 素 的 集合 中 的 第 阶 顺 序 统计 G= 12， 
…, 吕 即 为 该 集合 中 具有 第 i 小 关键 字 的 元 素 。 在 一 个 无 序 的 集合 中 ， 任 意 的 顺序 统计 都 可 在 
Oftn) 时 间 内 示 到 。 在 这 一 节 里 ， 我 们 将 介绍 如 何 修 改 红 - 昧 树 的 结构 ， 使 得 任意 的 顺序 统计 
都 可 在 QUg 时 间 内 确定 。 我 们 还 将 者 到 ， 一 个 元 素 的 秩 ( 邯 它 在 集合 的 线 插 序 中 的 位 置 ) 王 
癌 尾 地 在 DB B) 寺 间 内 确定 。 





路 15.1 一 棵 顺序 统计 侍 
图 15.1 中 庆 册 一 种 能 支持 快速 顺序 统计 井 作 的 数据 结构 , 它 是 增 广 的 红 - 棱 树 。 阴 影 节 


x 为 根 的 子 树 中 节点 的 个 数 。 一 棵 顺 订 统计 树 苹 是 在 每 个 节点 中 存储 了 附加 信息 的 红 - 桂 
检 。 在 这 种 树 的 每 个 节点 电 ， 除 了 通常 的 域 keyfxl,cclorfxj,p[Exjleft[x] 和 might[x] 外 ， 述 有 一 
个 三 size[x]。 这 个 附 吉 的 域 中 包含 了 以 节点 为 根 的 子 树 (包括 x 本 身 }) 中 节点 的 个 数 ， 即 该 
子 树 的 大 小 。 如 果 我 们 定义 size[NIL] 为 0， 则 有 等 式 
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Size[xj = sizeflefHjx 下 Hsize[9ight[x]HHi 
(为 了 能 正确 地 处 理 有 关 NIL 的 过 界 条 侍 ， 在 实际 实现 中 每 次 存 本 size 时 ， 都 要 测 法 
NIL。 ) 


检索 具有 给 定 秩 的 元 束 


在 说 明 插 人 和 吕 除 过 程 中 如 何 来 维持 size 信息 前 ， 先 来 看 看 利用 这 种 附 放 的 信息 来 实 
更 的 两 个 顺序 统计 查询 。 先 来 看 检索 具有 给 定 秩 的 趣 素 的 操作 。 过 程 OS-SELECT(x 眉 返回 
一 个 指 问 以 x 根 的 子 树 中 包含 第 i 小 关键 字 的 节点 的 指针 。 为 找 骨 顺序 统计 树 T 中 的 第 1 小 
甘 键 字 ， 调 用 过 程 OS-SELECTYroot[T] 让 。 

ODS 一 SELRCTIY 
1 号 - 当 zheftx]htri 
2 ifi=r 
3 then return 
寺 人 Iseif 1 
thenm ftBrn 但 8 一 SF1LECTIE 人 [Xi) 
看 else return ODS-SELEBCTIrightx]. 记 -) 

OS-SELECT 算法 的 基本 思想 与 第 十 章 中 介绍 的 选择 算法 的 思想 差不多 。 昔 sizebleftfx]] 
表示 在 对 以 x 为 根 的 子 树 进 行 中 序 让 历时 枯 让 基 之 前 的 节点 个 数 ， 这 样 ，size[leftfxl+l 即 为 
了 以 x 为 根 的 子 树 中 x 的 容 。 

QOS-SELECT 的 第 1 行 计 算 以 为 根 的 子 树 中 节点 x 的 秩 r。 如 果 i<r， 则 第 i 小 元 素 
就 在 x 的 左 子 树 中 ， 故 在 第 $ 行 中 对 leftx] 进 行 递 中。 如果 1i>r， 刚 第 i 小 元 素 在 X 的 右 子 
树 中 。 希 为 在 对 以 x 为 根 的 子 树 进行 中 序 过 上 历时， 共有 上 个 元 素 排 在 x 的 右 子 树 前 ， 故 存 以 
x 为 根 的 子 树 中 第 于 小 的 元 素 色 为 以 rightz 为 根 的 子 树 中 第 (iD 小 元 素 。 第 6 行进 一 步 递归 
他 确定 这 个 元 素 。 

为 杭 消 楚 OS-SELECT 的 工作 过 程 ， 考 虑 如 何 找 出 图 15.1 中 的 顺序 统计 树 中 第 17 小 

的 元 素 。 开 始 时 x 为 根 ， 其 关键 字 为 26，iji= 17。 因 为 26 的 左 子 树 的 大 小 为 123， 故 它 的 秩 
为 13。 这 样 ， 我 们 可 以 断定 秩 为 17 的 节点 是 26 的 右 子 树 中 第 17-13= 4 小 的 元 素 。 在 递归 
调用 后 ，x 为 具有 关键 字 41 的 节点 。i=4。 因 为 4] 的 左 子 树 的 天 小 为 $S， 故 它 的 秩 为 6。 于 
是 我 们 知道 具有 秩 4 的 节点 是 41 的 左 子 树 中 第 4 小 的 元 素 。 在 第 二 次 递归 调用 后 ，x 为 共 
有 关键 字 30 的 节点 ， 在 其 子 树 噶 x 的 秩 为 2， 这 样 ， 再 做 一 次 递归 就 找到 以 关键 为 38 的 节 
点 为 根 的 子 树 中 第 42=2 小 的 元 罕 。 该 元 素 的 左 笠 树 大 小 为 1， 这 意 昧 着 它 就 是 次 最 小 的 
元 素 。 到 此 为 止 ， 该 过 程 返 铝 一 个 指向 关键 字 为 38 的 节点 的 指针 。 

攻 为 每 一 次 递归 调用 都 在 顺序 统计 树 中 下 降 了 一 屋 ， 故 最 坏 情 这 下 ODS-SELECT 的 总 
寻 间 与 树 的 高 度 成 正比 。 浆 因为 该 树 是 棵 红 - 蛙 树 ， 其 高 度 为 Oflg mh， 其 中 肖 节 点 个 数 。 
所 以 ， 对 含 n 个 元 素 的 动态 集合 ，OS-SELECT 的 运行 时 间 为 OUlg n)。 


确定 一 个 元 素 的 秩 
给 定 指向 一 烦 序 统计 树 中 节点 X 的 指针 ， 过 程 OS-RANK 返回 在 对 T 进行 中 序 遍 
历 后 得 到 的 蚂 性 序 中 x 的 位 置 。 
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OS-RANKIT) 
1 resSize[iefttxl+ti 

了 了 < 其 

3 while yztroot[T] 

4 do ify 一 right[p[fyj .， 
5 then Te-TrHsizelleftEp[yJH 
6 y“ piy] 


了 Tetufnm 工 


这 个 算法 的 工作 过 程 是 这 样 的 ，x 的 秩 可 视 为 在 对 树 的 中 序 遍 历 中 排 在 x 之 前 的 节点 个 

数 再 加 上 1。 该 过 程 记 录 了 一 个 不 变量 : 在 第 3-6 行 的 while 循环 的 顶部 ，r 为 以 节点 y 为 

根 的 子 树 中 key[ 多 的 秩 。 我 们 如 下 来 维护 这 个 不 变量 。 在 第 1 行 中 ， 团 为 以 x 为 根 的 子 树 

中 key[x] 的 秩 。 第 2 行 中 置 yx 使 得 第 3 行 中 进行 测试 时 不 变量 首次 为 真 。 在 while 循环 的 

每 一 次 重复 中 ， 该 过 程 都 要 检查 以 pfy] 为 根 的 子 树 。 我 们 已 经 对 以 节点 y 为 要 的 子 树 中 在 中 

- 序 油 历 下 前 于 x 的 节点 个 数 进 行 了 计数 ， 歼 要 加 上 以 y 的 兄弟 为 根 的 子 树 中 在 中 序 遍 历 下 前 
于 X 的 节点 数 ; 另外 ， 如 果 Pty] 也 前 于 x， 则 该 计数 还 更 加 上 1。 如 果 y 是 个 左 巷子 ， 则 

py 乙 py] 的 右 子 树 中 的 所 有 节点 都 不 前 于 x， Fr 保 持 不 动 ; 和 理 则 ，y 是 个 右 和 孩子 且 p[y] 的 去 

子 树 中 的 所 有 节点 都 前 于 xx， 于 是 在 第 $ 行 中 ， 将 现行 的 ! 值 再 加 上 sizefleftfy]+4， 置 y< 一 

pfg 又 使 下 一 轮 循环 中 不 变量 为 真 。 当 y=root[T] 时 ， 该 过 程 返 回 天 的 值 ， 也 就 是 key 上 加] 的 
现在 来 看 一 个 例子 。 当 我 们 在 图 15.1 中 的 顺序 统计 树 上 运行 OS-RANK 来 确定 关键 字 
为 38 的 节点 的 秩 时 ，key[yl 和 工 的 -一 系列 值 如 下 : 





返回 的 秩 为 17。 
while 特 环 的 每 一 次 达 代 要 花 DU) 时 间 ， 且 在 每 次 选 代 中 沿 树 上 升 一 层 ， 帮 最 坏 情 襄 
下 ODS--RANK 的 运行 时 间 与 树 的 高 度 成 正 比 : 对 含 m 个 节点 的 顺序 统计 树 时 间 为 OUlg m)。 


对 子 树 规模 的 维护 “ 


给 定 每 个 节点 的 size 域 后 ，OS-SELECT 和 OS-RANK 能 迅速 计算 出 所 需 的 顺序 统计 
信息 然而， 除非 能 用 红 - 黑 树 上 基本 的 修改 操作 对 这 些 size 域 加 以 有 效 的 维护 ， 我 们 就 达 
不 到 期 望 的 目标 。 我 们 将 要 说 明 如 何在 不 影响 揪 人 和 删除 的 渐 近 时 间 的 前 提 下 维护 子 树 的 规 
模 。 

在 14.3 节点 我 们 已 经 知道 ， 红 -- 黑 树 上 的 播 人 操作 包括 两 个 阶段 。 第 一 阶段 由 根 开始 沿 
树 十 帮 ， 将 新 节点 插 人 为 某 个 已 有 节点 的 孩子 。 第 二 阶段 沿 树 上 升 ， 做 一 些 颜色 修改 和 旋转 
以 保持 红 - 黑 性 质 ， 四 

为 在 第 一 阶段 中 保持 子 树 的 规模 ， 对 由 根 至 叶子 的 路 径 上 届 历 的 每 个 节点 x 的 sizefx] 增 
加 。 新 增加 的 节点 的 size 为 1。 因为 斯 经 过 的 路 径 上 共有 OUlg nD) 个 节点 , 故 维护 size 域 的 额 
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外 代价 为 OUg D)。 
在 第 二 岩 眉 四， 对 红 - 墨 树 结构 上 的 改变 仅 是 由 旋转 所 致 ， 旋 转 次 数 至 多 为 2。 旋 转 是 ， 
一 种 局 部 巢 作 : 它 仅 影 响 旋 转 操作 的 支撑 链 两 关节 点 的 size 威 。 在 14.2 节 中 我 们 给 出 了 
LEFT-ROTATE(T,xj， 现 增加 下 面 几 行 代码 : 
13 。 sizefyj---size[x] 
14 size[x]<-sizeliefxIHsize[righftx 了 Hi 
-图 15.2 说 明了 size 域 是 如 何 被 更 新 的 。 杰 人 艇 改 的 商人 size 域 与 旋转 发 生 时 所 侠 绕 的 链 
关联 。 所 做 的 修改 都 是 局 部 的 ， 仅 需 存储 在 xx 和 yy 中 的 size 信息 ， 以 及 图 中 为 三 角形 的 子 
树 的 根 。 对 RIGHT-ROTATE 所 做 的 改动 是 对 称 的 。 


RIGHT-ROTATH ，P) 
aremwaramamemaemoeeee: 本 | 


罗 | 隐 aaaaaesmanassrtareatsmammva 


ESRFT- 让 DOTATET 人 





图 13,2 在 旋转 过 程 中 收 改 子 树 太 小 


红 一 黑 树 上 的 删 路 操作 同样 包括 两 个 阶段 : 

第 一 阶段 对 查找 权 进 行 操 作 ; 第 二 阶段 做 至 多 三 次 的 旋转 ， 否 则 不 做 任何 结构 上 的 改动 
【更 14.4 节 )。 第 -- 阶 段 中 要 删除 节点 y， 为 更 新 子 树 的 规模 ， 可 台历 一 条 由 节点 yY 至 要 的 路 
径 ， 并 碱 小 路 径 上 每 个 节点 的 size 域 。 因 为 在 含 m 个 节点 的 红 一 黑 树 中 这 样 一 条 路 径 的 长 度 
为 OUg m， 故 第 一 阶段 中 为 维护 size 域 所 花 的 额外 时 间 为 DGg 种 。 第 二 阶段 中 的 OO 次 旋 
转 可 如 插 人 寺 同 样 的 方式 来 处 理 。 这 样 ， 对 一 棵 含 nm 个 节点 的 顺序 统计 树 ， 播 人 操作 加 上 
删除 操 作 ， 再 加 上 维护 size 域 ， 共 需 DUg pn) 时 间 。 


15.2 ”如 何 扩 张 数据 结构 


在 算法 设计 过 程 中 ， 常 常 需要 对 基本 的 数据 结构 进行 扩张 ,以便 支 持 一 些 新 的 功能 。 这 
一 节 中 ， 我 们 要 来 讨论 这 种 扩张 过 程 串 的 各 个 步骤 ， 并 要 证 明 一 个 有 关 红 - 黑 树 扩张 的 定 
理 。 

对 一 种 数据 结构 的 扩张 过 程 可 分 为 四 个 步骤 ; 

() 选择 基础 数据 结构 

() 确定 要 在 基础 数据 结构 中 记录 的 附加 信息 

(3) 验证 可 用 基础 数据 结构 上 的 基本 修改 操作 来 维护 附加 信息 

() 设计 新 的 操作 。 

以 上 只 是 给 出 了 一 个 一 般 和 模式， 读者 不 应 盲目 地 遵循 这 些 步骤 。 许多 设计 过 程 采 用 的 是 
试探 法 ， 所 有 的 步骤 都 是 并 行 地 进展 。 例 如 ， 如 果 我 们 不 能 有 效 地 维护 附加 信息 的 话 ， 就 没 
必要 确定 附加 信息 以 及 设计 新 操作 ( 步 2 和 赣 和 。 然而， 这 个 四 步 方法 使 读者 在 扩张 数据 结 
构 时 能 集中 注意 力 ， 并 使 思路 清晰 。 
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在 15.1 节 中 设计 顺序 统计 树 时 ， 我 们 就 依照 了 这 些 步 驼 。 在 步骤 1 中， 我们 选择 红 -- 黑 
树 作为 基础 数据 结构 。 之 所 以 选择 这 种 结构 ， 是 困 为 它 能 有 效 地 支持 一 些 动 态 集合 操作 ， 如 ， 
MINIMUM，、MAXIMUM，SUCCESSOR 和 PREDPECESSOR 等 。 

在 此 巡 2 中 ， 我 们 提供 了 size 域 ， 它 可 以 存放 各 节点 的 子 树 规 模 的 信息。 一 般 地 ， 价 
加 信息 可 司 得 各 类 操作 更 加 有 效 。 例 如 ， 我 们 本 可 以 仅 用 树 中 存储 的 关键 字 来 实现 
QOS-SELECT 和 QOS-- 丸 ANK， 但 这 种 实现 的 运行 时 间 就 不 止 是 Otg mm 了。 有 些 时 候 ， 附 加 
言 息 .是 指针 类 信息 ， 而 示 是 具体 的 数据 ( 匈 练 习 15.2 一 虽 。 

在 步骤 3 中 ， 我 们 保证 了 播 人 和 山 除 操作 仍 能 在 DUg 中 时 间 内 维护 size 域 。 比 较 理 想 
的 是 对 弃 有 数据 结构 略 作 改 动 就 是 以 维护 附加 的 信息 。 例 如 、 如 果 我 们 把 每 个 节点 的 秩 存 在 
树 中 ， 则 OS-SELECT 和 OS-RANK 过 程 能 较 快 地 运行 ， 但 要 择 人 -- 个 新 的 最 小 元 素 则 
会 使 顶 中 每 个 节点 的 秩 发 生变 化 。 如 果 我 们 存储 的 是 子 树 的 规模 ， 则 插入 一个 新 元 素 的 操作 
仅 影 响 到 OUg nm) 个 节点 。 

在 步 要 4 中， 我 们 设计 了 操作 OS-SELECT 和 OS~RANK， 对 新 操作 的 需要 是 我 们 对 
数据 结构 进行 扩张 的 并 要 动因 。 有 了 时 , 我 们 并 不 设计 新 的 弗 作 ， 而 是 利用 中 加 信息 来 加 速 已 
有 操作 的 执行 速度 ( 见 练习 15.2 一 1 


对 红 -- 黑 树 的 扩张 


当红 ~ 黑 树 被 选 作 基础 数据 结构 时 ， 可 以 证 明 某 些 类 型 的 附 却 信息 总 可 用 插 人 和 删除 来 
进行 有 效 地 维护 ， 从 而 使 得 第 3 步 非 常 容易 。 下 面 定 理 的 证 明 与 15.1 节 用 顺序 统计 树 来 维 
护 size 域 的 思路 类 似 。 

定理 15.1( 红 - 黑 树 的 扩张 ) 设 域 了 对 含 nm 个 节点 的 红 - 黑 树 进 行 了 扩张 ， 旦 假设 某 节 点 
x 的 域 了 的 内 容 可 以 仅 用 节点 x，left[ 对 ， 和 rightfx 中 的 信息 (包括 弓 eft[xj] 与 fright[x 了 来 计 
算 。 这 样 ， 在 质 人 和 副 除 操作 中 我 们 可 以 在 不 影响 这 两 个 操作 OUg D) 渐 近 性 能 的 情况 下 对 
T 的 所 有 节点 的 了 值 进行 维护 。 

证 明 : 证 明 的 主要 思想 是 对 树 中 某 节点 大 的 了 域 的 改动 仅 会 波及 x 在 树 中 的 祖先 。 亦 
即 ， 修 改 fx 可 能 导致 fp[xj] 的 更 新 ， 改 变 fpfzj] 也 可 能 引起 fp[pfx] 的 改变 ; 沿 树 继续 下 
去 。 当 ffroot[TH 被 更 新 时 ， 不 再 有 别 的 节点 村 依赖 其 新 值 ， 这 个 过 程 就 结束 了 。 因 为 一 - 棵 
红 ~ 暴 树 的 高 度 为 code mn， 改变 某 节点 的 了 域 就 要 再 花 OUlg 的 时 间 来 更 新 被 该 修改 所 影响 
的 节点 。 

将 一 个 节点 x 插 入 T 的 过 程 包括 两 个 阶段 ( 兄 14.3 节 )。 在 第 一 阶 眉 中 ，x 被 插 人 为 一 个 
现存 节点 ptxl 的 孩子 。f] 的 值 可 在 OU) 时 间 内 计算 出 。 因 为 根据 假设 ，fx] 仅 依赖 于 x 的 其 
他 球 中 的 信息 和 x 的 子 节 点 中 的 生息 ， 但 这 时 x 的 两 个 子 节点 都 是 NIL。 一 旦 红 g] 被 求 出 
后 ， 这 个 变化 就 沿 树 向 上 传播 。 这 样 ， 插 人 的 第 一 阶 绒 的 总 时 间 为 DOtg 由 。 在 第 二 阶段 
中 ， 对 树 结 构 的 仅 有 改变 来 源 于 旋转 操作 。 在 一 次 旋转 中 只 有 了 两 个 节点 发 生变 化 ， 故 钙 次 旋 
转 中 重新 了 域 的 总 时 间 为 DQg 目 。 又 因为 插 和 人 操作 中 旋转 次 数 至 多 为 2， 故 播 人 的 总 时 间 为 
OUgmJ。 

和 播 估 一样， 删除 操作 也 包括 两 个 阶段 ( 抑 14.4 节 )。 在 第 一 航 段 中 ， 如 果 被 删除 的 节点 
由 其 后 继 替代 , 则 树 发 生变 化 。 这 些 变化 波及 到 f 的 代价 至 多 为 Dllg m， 因 为 这 些 变化 对 树 
的 影响 只 是 局部 的 。 第 二 叭 段 对 红 -- 黑 树 的 修改 复 至 多 需 要 三 次 旋转 , 且 每 次 旋转 鞭 多 需要 
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Ollg 中 时 间 就 可 将 变化 传播 到 人 这 样 ， 册 除 的 总 时 间 为 Dllg 吕 。 
在 许多 情况 中 (例如 在 顺序 统计 树 中 对 size 域 的 维护 )， 在 一 次 旋 乱 后 进行 更 新 的 代价 是 
COt1)， 而 并 不 是 定理 15.1 中 所 给 册 的 De 二 练习 15.2 一 4 给 出 了 一 个 例子 . 


1$.3 区 间 树 


在 这 一 节 里 ， 我 们 将 扩张 红 - 黑 树 以 支持 由 区 间 构 成 的 动态 集合 上 的 操作 。 一 个 闭 区 间 
-是 一 个 实数 的 序 对 [ti,bj， 其 中 王 系 包 。 区 间 [ttb] 表 示 了 集合 {tE 及 : 十 入 5 科 t。 开 区 间 和 半 
开 区 间 分 别 略 去 了 集合 的 两 个 或 一 个 端点 。 在 这 一 节 里 ， 我 们 假设 区 间 都 是 闭 的 (将 结果 推 
广 至 开 和 半 开 区 间 上 上 比较 简单 ).。 

区 闻 可 以 很 方便 地 表示 各 占用 一 段 连续 时 间 的 一 些 事件 。 例 如 ， 我 们 可 能 会 查询 一 个 由 
时 间 区 间 数 据 构成 的 数据 库 以 找 出 特定 的 区 间 内 发 生 了 什么 事件 。 这 一 节点 中 介绍 的 数据 结 
构 可 用 来 有 效 地 维护 这 样 一 个 区 间 数 据 库 。 

我 们 可 以 把 一 个 区 癌 上 Et 表 示 成 一 个 对 象 i 其 各 个 域 为 low[ 这 =t( 低 端 点 小 
highg]= te 高 端点 )。 我 们 说 区 间 1 和 ji 重 普 ， 如 果 i 门 导 由， 亦 即 ， 如 果 low[j 和 highii]， 且 
lowf{ 这 么 highil。 任 意 两 个 区 间 和 ii 满 号 区间 三 分 法 , 亦 即 ， 下 列 三 种 情况 中 只 有 一 种 成 
立 : 

”ai 征 i 重 状 ， 

b. bigh 鸭 <low 的 ] 

c. highfid4<low 上 加 和 ” 

图 15.3 示 出 了 三 种 情 咒 : ta) 如 果 i1 和 i” 重要 ， 则 共有 四 种 情况 ; 在 每 种 情 襄 中 ，lowj 
highi”] 以 及 low ] 和 highiil， (by high 轩 <Jowfi ] 《ce) highfi]<low 国 
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区 间 树 是 对 一 一 动态 集合 进行 维护 的 红 - 早 树 ， 该 集合 中 的 每 个 元 素 X 都 包含 一 个 区 间 
int[xj。 区 间 树 支持 下 列 操 作 : 

INTERVAL-INSERTITO: 将 包含 区 间 城 int 的 元 素 x 揪 人 到 区 间 树 T 中 。 

INTERVAL-~-DELETEIT 菇 : 从 区 间 树 工 中 删除 元 素 x。 

INIERVAL-SEARCH(I5: 返回 一 个 指 提 区 间 树 T 中 元 素 X 的 指针 ， 使 int 与 1 重 
要 ;或 集合 中 无 此 元 素 存 在 时 返回 NIL， 
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图 15.4 说 明了 区 间 树 是 如 和 何 表示 一 个 区 间 集 全 的 。 (a)j 十 个 区 间接 左 端 点 自 育 向 上 顺 
序 示 出 。 (b) 表示 它们 的 区 间 树 。 对 该 树 做 中 序 遍 历 即 可 按 左 端点 顺序 列 出 各 个 节点 。 我 
们 下 面 要 按 15.2 节 中 的 四 步 模式 来 回顾 区 间 树 以 及 区 间 树 上 的 操作 的 设计 过 程 。 
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图 15.4 ”一 棵 区 间 树 


步 又 1 ”基础 数据 结构 

我 们 选择 的 基础 数据 结构 为 这 样 一 种 红 -- 黑 树 ， 其 中 每 个 节点 x 包含 一 个 区 间 域 imtxjx 
的 关键 字 为 区 间 的 低 端 点 lowfint[xjlj。 这 样 ， 对 树 进行 中 序 遍 历 就 可 按 低 端 点 的 次 序列 出 各 

区 间 。 

步骤 2 附加 信息 

每 个 节点 x 中 除了 区 间 信 息 外 ， 还 包含 一 个 值 max[x]， 即 以 x 为 根 的 子 树 中 所 有 区 间 
的 端点 的 最 大 值 。 因 为 任 一 区 间 的 高 端点 译 少 和 其 低 端 点 一 样 大 ， 政 max[ 是 以 为 根 的 
子 树 中 所 有 区 间 的 右 闯 点 中 的 最 大 值 。 

步 阳 3 ”对 信息 的 维护 

要 验证 对 舍 na 个 节点 的 区 间 笃 的 插入 和 册 除 能 在 Odg 问 时间 内 完成 。 给 定 区 间 intbd 和 
X 的 子 节 点 的 max 值 ， 我 们 可 以 确定 max[x]: 

max[x]= Imax(high[int[x]l，max[lefttxjl]，maxFrightx]) 

这 样 ， 根 据 定理 15.1 可 知 ， 插 人 和 删除 操作 的 运行 时 间 为 00lg m。 事 实 上 ， 在 一 次 旋 

转 后 更 新 max 域 只 需 O(D 时 间 ， 如 练习 15.2~4 和 15.3-! 中 所 示 的 那样 。 
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步 吏 4 设计 新 的 操作 
我 们 唯一 需要 的 新 操作 是 TNTERVAL-SEARCHCT)， 它 用 来 找 出 树 T 中 复 盖 区 癌 
的 那个 区 间 。 如 果 这 样 的 区 间 不 存 不 ， 则 返回 NIL。 
IDNTE 丸 WAL 一 SEE 点 RCHCT, 
1 xs-root[T] 
2 while x+ 上 NILandi 没 有 可 草 int[x] . 
和 do 这 ieft[x] 关 NIL and 页 ax[le 人 [x]] 六 1ow[ 天 
和 themn Xe]eft[ 天 ] 
5 else X- 一 right[x] 
日 “TetuTIl 天 


查找 与 站 交 选 的 区 间 x 的 过 程 先 以 x 为 树 根 开始 ， 逐 步 下 降 。 当 找到 一 个 重 选 区 域 或 返 
回 NIL 时 该 过 程 结束 。 因 为 基本 循环 的 每 次 迁 代 要 花 OU) 时 间 ， 又 含 卫 个 节点 的 红 - 蛙 树 
的 高 度 为 Dllg mm， 帮 INTERVAL-SEARCH 过 程 的 时 间 为 OUg 名 。 

在 说 明 INTERVAL-SEARCH 的 正确 性 之 前 ， 我 们 先 来 看 铬 它 作用 于 图 15.4 中 区 间 
树 土 的 过 程 是 怎样 的 。 俱 设 我 们 想 找 到 一 个 与 区 间 i= [22,23] 重 和 要 的 区 间 。 开 始 时 x 为 根 节 
点 ， 它 包含 [16,.21]， 并 不 与 i 重生 ， 因 为 max[left[xj]= 23 天 于 low]= 22， 所 以 把 X 作 为 根 
的 左 孩 子 继续 循环 。 现 在 包含 [8,9]， 人 不 与 1 重合。 这 一 次 ，maxfleft[xll= 10 小 于 
lowfl= 22， 故 将 x 的 右 孩 子 作为 新 的 x 继 续 循环 。 这 个 节点 所 包含 的 区 间 [15,23] 与 1 重 倒 ， 
则 过 程 结束 并 返回 这 个 节点 。 

现在 来 看 一 个 不 成 功 查 找 的 例 。 假 设 我 们 想 在 图 15.4 的 区 间 树 中 找 出 与 i=[1114] 重 杰 
的 区 间 。 开 始 时 以 x 为 根 。 因 为 根 的 区 间 f[16,21] 不 与 1 重 琶 ， 又 max[left[xj]]= 23 大 于 
low 轨 = 11， 则 转向 左面 的 包含 [8.9] 的 节点 (注意 右 子 树 中 没有 一 个 区 间 与 重生， 其 原因 将 
在 后 面 说 明 )， 区 间 [8, 引 不 与 1 重 杰 ， 且 max[leftfx = 10 小 于 low[fi= 11， 因 而 转向 右 子 树 { 
注意 其 左 子 树 中 没有 一 个 区 间 与 i 重 登 )， 区 间 [15,23] 也 不 与 1 重合 ， 且 它 的 二 孩子 为 NIL， 
故 向 右 转 ， 循 环 结束 ， 返 回 NIL. 

要 理解 NITERVAL-SEARCH 的 正确 性 ， 就 要 理解 为 什么 只 检查 一 条 由 根 开始 的 路 径 
就 足够 了 。 该 过 程 的 基本 思想 是 在 任意 节点 X 上 ， 如 果 int[x] 不 与 1 重 登 ， 则 查找 总 是 消 一 
沾 安全 的 方向 前 进 的 : 如 果树 中 确 有 一 与 i 重 亚 的 区 阳 则 必定 会 被 找到 。 下 面 的 定理 更 准确 
地 陈述 了 这 个 性 质 。 

定理 1S.2 在 INTERVAL-SEARCHI(T,i 的 每 次 while 循环 中 : 

(1 如果 执行 了 第 4 行 ( 查 转向 左 转 )， 则 xx 的 在 了 入 中 他 会 本 i 重 春 的 区 间 ( 或 说 x 的 右 
子 树 中 没有 一 个 区 间 与 1 重 亚 )。 

(2 如 果 执 行 了 第 5 行 ( 查 转向 右 转 )， 则 x 的 左 子 树 中 不 包含 与 1 重 登 的 区 间 。 

证 明 : 凑 种 情况 的 证 明 都 依赖 于 区 间 三 分 法 , 各 区 间 见 图 15.5。max[left[xj] 的 值 在 每 种 
情况 中 以 一 条 虚线 指示 。(a) 情 况 2: 查找 向 右边 进行 。 任意 i” 都 不 与 1 重 人 要。tb) 情 况 1: 
查找 向 左边 进行 ，x 的 左 子 树 包 含 一 个 与 1 重 亚 的 区 间 〈 具 体 情形 没有 示 出 )， 或 在 工 的 严 子 
树 中 有 个 区 间 i 7” 使 得 highi 7 ]=imaxfleft[xj。 因 为 ji 不 与 1” 重 晋 ， 故 它 记 不 与 X 右 子 树 中 
的 任何 区 间 i” 重合 ， 因 为 lowii” ]< 和 [iy 1]。 第 二 种 情况 较 简 单 些 ， 我 们 先 来 对 它 证 明 。 注 意 
到 如 果 第 5 行 被 执行 的 话 ， 则 因为 第 3 行 中 的 分 支 条 件 ， 有 leftfx] =NIL 或 
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tax[left[xl < lowfl。 
如 果 leftt 几 = NIL， 则 议 leftbg] 为 根 的 子 树 显然 不 包含 任何 与 1 重重 的 区 间 、 因 为 它 根 本 ， 
就 不 包含 任何 区 间 。 假 设 lefttq 夭 NIL 且 maxJieft[ 可 <low 便 , 设 i 为 x 的 左 子 树 中 的 一 个 区 
间 ( 妈 图 15.S(a))。 因 为 mmaxfleftizjj 是 x 左 子 树 中 的 最 大 端点 ， 我 们 有 
high[ 轨 过 iaxfleftbx]j 
<jiow 回 


故 根 据 区 间 三 分 法 ，i 与 1 不 重重 ， 这 就 完成 了 第 一 种 情况 的 证 昌 。 
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415. 在 尖 理 15.2 阴 还 明 中 的 各 个 区 阳 


为 证 峙 第 一 种 情况 ， 我 们 可 以 假设 x 的 左 子 树 中 没有 区 间 与 ii 重 琶 ( 如 果 有 这 样 的 区 间 
的 话 ，。 则 证 明 就 结束 了 )。 这 样 只 要 证 明 在 此 假设 下 x 的 右 子 树 中 届 有 区 间 与 ij 重 驮 即 可 . 
注意 到 如 果 第 4 行 被 执行 ， 则 因为 第 3 行 中 的 分 支 条 件 ， 我 们 有 max[ieft[x]>ltow[]。 更 进 
一 步 根据 mmax 域 的 定义 ， 在 区 的 左 子 树 中 必 有 区 间 ji， 使 得 

highfi]= maxleft[x] 
3low 国 
{ 图 15.5(b) 说 明了 这 个 情况 ) 因 为 i 与 工 不 重合 ， 广 high[ij<low 国 不 成 立 ， 则 根据 区 交 三 分 法 
有 high 四 <tlow[i]。 区 间 树 是 以 区 间 的 低 端点 为 关键 字 的 ， 所 以 查找 树 性 质 隐 含 了 对 x 的 右 
子 树 中 的 任何 区 间 i”， 有 
high[j<low 的 和 low6 7 ] 

根据 区 间 三 分 法 ，i 和 ii 不 重 。 

定理 . 15.2 保证 了 如 果 TINTERVAL-SEARCH 继续 作用 于 x 的 某 个 子 节点 时 仍 没有 
到 重 查 区 间 ， 刚 对 大 的 娘 一 一 个 子 节点 进行 查找 同样 也 不 会 有 什么 结果 。 


是 考题 
1S-i 芥 大 重重 点 
假设 我 们 希望 对 一 组 区 闻 记 录 一 个 最 大 重 和 亚 点 ， 亦 即 复 盖 它 的 区 间 最 多 的 那个 点 。 训 明 
当 插 人 和 删除 区 间 时 、 如 何 有 效 地 维护 最 大 重 准 点 。 
15-2 Josephns 排列 


Josephus 问题 的 定义 如 下 :假设 个 人 排 成 环形 ， 且 有 一 正 整数 mm 和 n。 从 某 个 指定 的 
人 开始 ， 沿 环 计 雪 。 每 遇 到 第 mm 个 人 就 让 其 出 列 ， 且 计数 进行 下 去 。 这 个 过 程 一 直 进行 到 


所 有 的 人 都 出 列 为 止 。 每 个 人 出 列 的 次 序 定 义 了 整数 1,2,… 的 (nm)-Josephus 排列 。 例 
如 ，(7,3)-Josephus 排列 为 <3,6.2,7,5,1,4> 。 
Ga) 假设 mm 是 个 常数， 请 撒 述 一 个 On) 时 间 的 算法 ， 使 之 对 给 定 的 整数 n， 输 出 
(am) 一 Joseptnmns 排列 。 
(bj 假设 巴 不是 个 常数 。 请 描述 一 个 On itg 世 时 间 的 算法 ， 使 对 给 定 的 整数 mn 和 上 
输出 (nm) 一 Josephus 排列 。 


练习 十 五 


15.1-1 说 明 OS-SELERCTOTI10) 作 用 于 15.2 中 红 -- 黑 树 的 过 程 。 

15.1-2 说 明 DS-RANKKCT, 妇 作用 于 图 15.2 中 的 红 -- 黑 树 及 节点 X 关 键 字 为 35) 的 过 程 

15.1-3 写 出 O8S-SELECT 的 非 递归 版 本 . 

15.1-4 ” 写 出 一 个 递归 过 程 OS-KEY-.RANKKT, 扣 使 之 以 一 顺序 统计 树 工 和 某 个 关键 字 k 为 输 大 ， 
返回 在 由 T 表示 的 动态 集合 中 的 秩 。 假 设 工 的 所 有 关键 宇都 是 不 同 的 . 

15S.1-5$ 和 定 售 个 元 束 的 顺序 统计 树 中 的 一 个 元 素 工程 一 个 自然 数 i， 如 和 何在 Dig mm 时间 内 确定 x 
在 该 树 的 线性 序 中 第 i 个 后 继 ? 

15.1-6 在 避 S-SELECT 或 DS-RANRKR 中 ， 每 次 引用 size 域 都 公 是 为 了 计算 在 以 x 为 根 的 子 树 中 x 
的 秩 。 假 设 我 们 将 每 个 节点 的 秩 ( 对 于 以 访 节 点 为 根 的 子 树 午 言 ) 存 于 该 节点 自身 之 中 。 说 明 在 播 人 和 册 除 时 
如 何 来 维护 这 个 信息 ( 注 套 这 两 种 操作 可 能 引起 旋转 )。 

15,1-7 说 明 如 何 利用 顺序 统计 树 在 DUOg 自 时 间 内 对 大 小 为 an 的 数组 中 的 道 序 对 ( 见 和 问题 1 一 引进 行 计 
数 ， 
154.1-8* 现 有 一 个 贺 上 的 m 双 世 ， 每 条 汞 都 是 按 其 端点 来 定义 的 。 请 给 出 一 个 能 在 Otn lg 时间 内 


确定 在 加 内 相交 的 张 的 对 数 例如， 如果 呈 条 至 都 是 直径 ， 它 们 相交 于 国 心 ， 则 正确 的 答案 为 ( 
假 没 所 有 弦 的 端点 均 不 重合 . 


1$.2 -1 说 明 如 何 能 在 扩张 的 顺序 统计 树 上 以 最 坏 情 况 DID 的 时 间 来 支持 动态 集合 查询 
MINIMUM，MAXIMUM，SUCCESSOR 和 PREDECESSOR。 顺 序 统计 树 上 的 其 他 操作 的 汤 近 性 能 应 
该 不 受 影响 。 

15.2-2 能 在 不 影响 任何 红 - 黑 树 探 作 的 渐 近 性 能 的 前 提 下 ， 将 节点 的 黑 高 度 作 为 一 个 域 来 维护 ? 如 果 
可 以 的 话 ， 说 明 怎 样 做 ; 如 果 不 行 的 话 ， 说 明 为 庆生， 

15.2-3 ”能 否 将 红 -- 黑 树 中 节点 的 深度 作为 一 个 域 来 进行 有 效 的 维护 ? 

15.2-4 + 设 的 为 一 个 二 元 结合 竺 淡 ， 另 设 a 为 红 黑 匀 的 等 “节点 中 的 一 一 个 域 。 假 设 我 们 想 在 每 个 
节点 其 中 增加 一 个 域 太 使 和] =a[x]Gafzi] 的 … 罗 a[x]， 其 中 xn xz ,xm 是 以 x 为 根 的 子 树 中 按 中 序 排 
列 的 所 有 节点 。 证 明 在 一 次 旋转 后 可 在 OH 时 间 里 对 f 妨 作 四 合适 的 入 下. 

15.2-4 * ”我 们 看 望 通过 增加 操作 RB--ENUMERATE(x,a'h,) 来 扩张 红 -- 黑 树 。 该 操作 输出 所 有 的 关 
键 字 丰 ， 使 在 以 x 为 根 的 红 - 黑 树 中 有 askshb。 描 述 如 何在 @(m+ lg 可 时 间 里 实现 RB-ENUMERATE， 
其 中 刁 为 输出 的 关键 字数 ，n 为 树 中 内 节点 的 个 数 . (提示 : 没 必 要 向 红 -- 黑 树 中 增加 新 的 域 ) 


15.3-1 写 出 作用 于 区 间 树 的 节点 并 于 O(D 时 间 内 更 新 tmax 域 的 LEFT-ROTATE 的 伪 代 码 。 

15.3-2 重 写 INTERVAL-SEARCH 代码 ， 使 当 所 有 的 区 间 都 是 开 区 间 时 ， 它 也 能 正确 地 工作 。 

15.3-3 ”请 给 出 一 个 有 效 的 算法 ， 使 得 对 给 定 的 区 间 ji 它 返 回 一 个 与 1 重 酸 的 ， 其 有 最 小 低 端 点 的 区 
间 ; 或 这 样 的 区 同 不 存在 时 返回 NIL.。 

15.3-4 给 定 一 棵 区 间 树 和 一 个 区 间 i， 请 措 述 出 如 何 能 在 Otminnk 至 o) 时 间 内 列 出 了 中 所 有 与 i 重 
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亚 的 区 间 ， 此 处 k 为 输电 的 区 间 数 。 

153-5 请 说 明 要 对 前 面 介 绍 的 有 关 区 间 树 的 过 程 作 哪 些 修改 才能 支持 操作 
INTERVAL-SEARCH-EXACTLY(Tji 它 返回 一 个 指 身 区间 树 T 中 节点 x 的 指针 ， 使 
low[int[xl] =lowf[i:high[intpJ1 一 high[， 或 当 T 床 包 含 这 样 的 节点 时 返回 NIL。 所 有 的 操作 (包括 INIER- 
VAL-SEARCH-EXACTLY) 的 运行 时 间 应 为 DO 地 名 。 

15.3-6 ”说 明 如 何 来 维护 一 个 支持 操作 MIN-GAP 的 动态 数 集 Q， 使 该 操作 能 给 出 驴 中 最 近 的 两 个 
救 之 间 的 差 幅 。 例 如 ， 如 果 Q= 1159,15,18.22}， 则 MIN-GAP(Q) 返 回 18-15=3， 因 为 15 和 18 为 口中 
最 近 的 两 个 数 ， 注 意 合 操作 INSERT，DELETE，SEARCH， 和 MIN-GAP 尽 可 能 高 效 ， 并 分 析 它 们 的 
运行 时 间 . 

15.3-7 * “VLSI 数据 库 通常 将 一 坎 集 成 电路 表示 成 一 组 矩形 。 根 设 每 个 矩形 的 边 都 平行 于 x 轴 或 了 
轴 ， 国 褒 矩 形 的 表示 中 有 最 小 和 最 大 的 工 和 y 尘 标 。 请 给 出 一 个 能 在 DUg im 时间 娃 确 定 一 组 扎 形 中 是 否 有 
两 个 重 倒 的 等 法 。 你 给 出 的 算法 不 一 定 要 输出 所 有 相交 的 矩形 。 但 要 能 在 一 个 矩形 完全 被 另 一 个 覆盖 时 给 
出 再 确 的 判断 。 (提示 : 将 一 条 线 移 过 所 有 的 矩形 ) 


一 202- 一 . 


第 四 篇 ”高 级 设计 和 分 析 技术 


这 一 部 分 涉及 设计 和 分 析 高 效率 算法 的 三 种 重要 技术 : 动态 程序 设计 (第 十 六 章 )， 贪 心 
算法 (第 十 七 章 ) 和 平反 技术 { 第 十 八 章 )。 前 面 的 内 容 介绍 了 一 些 普 遍 应 用 的 技术 ， 如 分 治 
法 ， 戎 机 化 和 解 递 归 式 等 。 这 一 部 分 要 介绍 的 新 技术 要 更 复杂 些 ， 但 它们 对 有 效 地 解决 许多 
计算 问题 来 说 也 是 很 重要 的 。 这 一 部 分 的 主要 内 容 在 本 书 的 稍 后 部 分 还 要 作 进 一 步 讨论 。 

动态 程序 设计 主要 应 用 于 最 优化 问题 ， 即 要 做 出 一 组 选择 以 期 达到 最 优 结果 。 在 作 选 择 
的 同时 ， 可 能 会 出 现 同 样 形式 的 一 些 子 问题 。 当 某 一 特定 的 子 问题 出 自 于 多 于 一 个 的 选择 的 
集合 时 ， 动 态 程序 设计 是 很 有 效 的 ; 关键 技术 是 记忆 每 一 子 问题 的 解 ， 以 备 它 重新 出 现 。 第 
十 六 章 将 说 明 如 何 根据 这 种 思想 来 将 指数 时 间 的 算法 转化 为 多 项 式 时 间 的 算法 。 

像 动 态 程序 设计 算法 一 样 ， 俩 心算 法 主要 也 是 应 用 于 最 优化 问题 。 该 算法 的 思想 是 以 局 
部 最 优 的 方式 来 做 每 一 个 选择 。 一 个 简单 的 例子 是 找 有 零钱 的 问题 : 在 用 硬币 兑换 一 定数 额 的 
钱 时 ， 为 使 硬币 数 最 少 ， 可 以 重复 地 选择 最 大 面值 的 硬币 (在 余额 的 限度 内 )。 对 许多 问题 来 
说 ， 采 用 贪心 法 可 以 比 动 态 程序 设计 方法 快 得 多 地 给 出 一 个 最 优 解 。 但 是 ， 对 给 定 的 问题 来 ， 
说 ， 采用 贪心 法 是 吾 - 定 有 效 却 并 不 总 是 那么 容易 判断 的 。 第 十 七 章 回顾 了 和 抢 阵 胚 理 论 ， 它 
可 用 来 帮助 作出 这 类 判断 | 

平反 分 析 是 用 来 分 折 执 行 _- 系 列 关 仙 操作 的 算法 的 。 在 这 种 方法 中 ， 不 是 单 儿 地 对 每 
次 操作 了 眼界， 而 是 对 整个 的 操作 序列 限界 。 这 种 方法 会 奏效 的 原因 之 一 是 不 可 能 一 个 操作 序 
列 中 的 每 一 个 都 以 其 最 坏 时 间 运 行 。 可 能 某 些 操 作 的 代价 要 高 些 ， 而 另 一 些 则 可 能 低 些 。 平 
排 分 析 不 仅仅 是 一 种 工具 。 它 也 是 设计 算法 时 的 一 种 思维 方法 ， 因 而 对 算法 的 设计 和 对 其 运 
行 时 间 的 分 析 是 紧密 相关 的 。 第 十 作 章 介绍 平 推 分 析 的 三 种 等 价 方法 。 
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第 十 六 章 ”动态 程序 设计 


像 分 治 法 一 样 ， 动 态 程序 设计 是 通过 合并 子 问题 的 解 而 解决 整个 问题 的 (此 处 “程序 设 
计 "* 是 指 一 种 表格 方法 ， 而 非 写 计算 机 代码 }。 我 们 在 第 一 章 中 已 经 知道 ， 分 治 法 是 将 原 问题 
划分 成 独立 的 子 问题 ， 递 归 地 解 各 子 问题 ， 再 合并 子 问题 的 解 以 得 到 原 问题 的 解 。 与 此 不 同 
的 是 ， 动 态 程 序 设计 要 求 各 子 问 题 是 不 独立 的 ， 亦 邯 各 子 问题 包含 公共 的 子 子 问题 。 在 这 种 
情况 下 ， 若 用 分 治 法 则 要 做 许多 不 必要 的 工作 ， 重 复 地 解 公共 子 问题 。 动 态 程序 设计 算法 对 
各 个 子 子 问题 只 解 一 次 ， 将 其 结果 置 于 一 个 表格 之 中 ， 从 而 避免 每 次 磁 到 时 都 要 重复 计算 。 

动态 程序 设计 主要 应 用 于 最 优化 问题 。 这 类 问题 会 有 多 种 可 能 的 解 ， 每 个 解 都 有 一 个 
俏 ， 而 我 们 的 希望 是 找 出 具有 最 优 (最 大 或 最 小 ) 值 的 解 。 我 们 称 这 样 的 解 为 该 问题 的 一个， 
最 优 解 (而 不 是 问题 的 最 优 解 )， 因 为 可 能 存在 着 若 干 个 取 最 优 值 的 解 。 

设计 一 个 动态 程序 设计 算法 的 过 程 可 分 为 四 个 步 骏 : 

(D 刻 划 最 优 佣 的 结构 ; 

(2) 递归 定义 最 优 和 解 的 值 ; 

G) 按 自 底 向 上 的 方式 计算 最 优 解 的 信 

(4) 由 计算 出 的 结果 构造 一 个 最 优 解 。 

第 1-3 步 构成 了 一 个 问题 的 动态 程序 设计 解 的 基础 。 第 4 步 在 只 要 求 计 算出 最 优 解 的 
值 时 可 以 省 路 。 如 果 我 们 做 了 第 4 步 ， 则 有 时 我 们 要 在 第 3 步 的 计算 中 记录 一 些 附加 信息 ， 
以 便 构造 一 个 最 优 解 。 

下 面 的 各 节 要 利用 动态 程序 设计 方法 来 解决 一 些 最 优化 问题 。16:1 节 的 问题 是 问 在 做 
一 连 捉 的 矩阵 乘法 时 ， 如 何 才能 使 所 做 的 标量 乘法 最 少 。 在 给 出 了 这 个 动态 程序 设计 的 例子 
后 ，163 节 讨 论 了 适合 于 这 种 技术 来 解决 的 四 是 的 两 个 关 刍 特征 ， 16.3 节 将 介绍 如 何 找 出 


两 个 序列 的 最 长 公共 子 序列 ， ，16-4 节 中 利用 动态 程序 设计 技术 来 找 一 个 凸 多 边 形 的 
最 优 三 角 部 分 ， 让 个 是 与 降 甸 法要 其 人 
16.1 和 抵 阵 链 乘 法 


我 们 用 来 说 明 动 态 程序 设计 的 第 一 个 例子 是 解决 矩阵 链 乘 法 的 一 个 算法 。 给 定 一 个 mn 

个 变相 乘 的 抢 阵 序列 ( 链 )< AAA .> ， 要 求 出 乘积 
(16.1 

为 计算 (16.1)， 我 们 可 将 两 个 撮 阵 相 乘 的 标准 算法 作为 一 个 子 程序 ， 根 据 括号 给 出 的 计 
算 顺 序 做 完全 部 的 抢 阵 溢 法 。 一 组 矩阵 的 匀 积 是 完全 括号 化 的 ， 如 果 它 或 是 单个 的 乍 阵 ， 
或 是 两 个 完全 括号 化 的 矩阵 的 乘积 外 加 括号 而 成 。 和 矩阵 雪 法 是 可 结合 的 ， 故 无 论 怎样 加 括 
号 都 产生 出 相同 结果 。 例如， 如 果 矩 阵 链 为 < A,，A,，A,，A, > ， 乘 积 AA,A,A, 可 
用 五 种 方式 完全 括号 化 : 


(AAA AI 
(AAA, AD 
((A AJJ(A,A 人 
(AAADA) 
((A A,)A)A,) 
对 矩阵 链 加 括号 的 顺序 对 求 乘积 运算 的 代价 有 很 大 影响 。 先 来 看 看 两 个 年 阵 相 乘 的 代 
价 。 标 准 的 算法 由 下 面 的 伪 代 码 给 出 。 属 性 fows 和 columns 为 一 矩阵 中 的 行 数 和 列 数 。 


MATRIX-MULTIPLYI(A,B) 
1 证 cotninng[AFErows[ 了 了 ] 


2 then ertorsincompatible 而 mensioney 

3 else for ie to Fows[ 上 ] 

太 do forja-tto columnsiB] 

5 do Clijl<-0 

后 fork=-li to colnmnas[A) . 
了 do Cj 各 [jl 十 二 [ik] * 了 [K 训 

8 Teturn 己 


两 个 矩阵 A 和 B 只 有 当 A 的 列 数 等 于 B 的 行 数 时 才 可 相好 . 如 果 A 是 个 p* q 矩 ，B 
是 个 q*r 矩阵 ， 则 结果 矩阵 C 是 p*r 的 。 计 算 C 的 时 间 由 第 ? 行 中 标量 委 法 运算 的 次 数 
决定 ， 这 个 次 数 是 pqr。 后 面 对 运 行 时 间 的 分 析 都 将 以 标量 乘法 次 数 来 表示 。 

为 说 明 由 不 同 的 括号 化 顺序 所 带 来 的 矩阵 科 积 的 不 同 代价 ， 考 虑 三 个 矩 咽 的 链 
<A ，A,，A, > 的 乘法 间 题 。 假 设 三 个 矩阵 的 维 数 分 别 为 10 x 100，100 x 5，5 x 50。 
如 果 按 ((A A_)A ) 规定 的 次 序 来 做 乘法 ， 则 为 求 A,A, 要 做 10 . 100 5 = 5000 次 的 标量 
乘法 送 算 ， 再 节 上 A， 还 要 做 10 . 5 . 5 = 2500 次 运算 ， 总 共 7500 次 标量 乘法 运算 。 如 果 
按 (A(A,A 沪 的 次 序 来 计算 ， 则 为 求 A,A, 要 做 100 . 5 50 - 25000 次 标量 乘法 运算 ， 再 
乘 上 A， 时 还 要 做 10 . 100 . 50 = 50000 次 运算 ， 总 共 75000 次 运算 ， 这 样 ， 按 第 一 种 运算 
次 序 进行 计算 就 要 快 到 !0 倍 。 

矩阵 链 乘 法 问题 可 表述 如 下 : 给 定 na 个 矩阵 构成 的 一 个 链 < AAA。> ,i 
= 12…n, 矩阵 A 的 维 数 为 PB，，x p,， 对 乘积 A,A,…A。 以 一 种 最 小 化 标量 乘法 次 数 的 
方式 进行 完全 括 导 化 。 《 


计算 括号 化 的 重 数 


在 利用 动态 程序 设计 方法 来 解 矩 阵 链 乘法 问题 之 前 ， 我 们 要 认识 到 靠 穷尽 所 有 可 能 的 括 
叶 化 方案 是 不 会 产生 出 一 种 有 效 的 算法 的 。 我 们 用 P(m) 来 表示 一 列 m 个 抢 阵 的 可 能 的 括号 
化 方案 数 。 因 为 我 们 可 将 一 列 mn 个 矩阵 从 第 下 个 和 第 (k+D 个 处 分 型 开 ，k= 12,…，m-1， 
然后 对 两 个 子 序 列 分 别 加 括 导 ， 则 可 得 递归 式 


1 如 果 n = 1 
Pn) 一 1 忆 
》 PP 一 妇 如 果 D>2 
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问题 13-4 曾 蓝 求 读者 证 明 这 个 递归 式 的 解 为 Catalan 数 序列 : 
Pfm) 一 C 人 一] 
其 中 


CO = 一 上 人) 


__ fd4" 1/ 2 
上 族 解 的 个 数 为 n 的 指数 ， 这 就 说 明了 对 确定 抢 阵 链 的 最 人 已 括 号 化 来 说 穷尽 搜索 不 是 一 


种 好 的 策略 。 
最 优 括 号 化 的 结构 


动态 程序 设计 模式 的 第 一 步 为 刻 划 一 个 最 优 佣 的 特征 。 对 于 和 矩阵 链 乘 法 问题 ， 这 一 步 可 
这 样 来 贱 。 为 方便 起 见 ， 用 记号 Ai ; 表示 对 习 积 AiAi…Ai 求 值 的 结果 。， 对 乘积 AIA2…A。 
的 一 种 最 优 括 导 化 将 乘积 在 Al 与 Atil 间 分 开 ， 此 处 上 为 1 和 k<n 之 间 的 一 个 整数 。 这 就 
是 说 ， 对 某 个 k 值 ， 我 们 先 计算 Aij， 和 Au ， 和 再 把 它们 相 乘 就 得 到 最 终 解 A 。。 这 样 ， 
这 个 最 优 括号 化 的 代价 即 为 计算 Aix 与 Aurian 的 代价 之 和 ， 再 加 上 岗 者 相 滋 的 代价 。 

要 注意 的 关键 一 点 就 是 对 AIAz…A。 最 优 括号 化 的 “前 邹 " 子 链 AIA…Ak 的 括号 化 必须 
是 AIA:…Au 的 一 个 最 优 括 导 化 。 为 什么 ? 如果 对 AiA:…Aks 有 一 个 代价 更 小 的 括号 化 ， 那 
么 把 它 替 换 到 AIA;…A, 的 最 优 括号 化 中 去 就 会 产生 另 一 种 插 号 化 ， 其 代价 小 于 最 优 代价 ， 
则 出 现 矛 慎 。 同 样 地 ， 对 子 链 A ;As…A, 的 括号 化 也 要 求 是 最 优化 的 。 
可见， 和 撼 阵 链 乘 法 问题 的 一 个 实例 的 最 优 解 包含 了 其 子 问题 的 实例 的 最 优 解 。 一 个 最 优 
解 的 最 优 子 结构 是 动态 程序 设计 的 应 用 的 标志 之 一 ， 这 一 点 我 们 将 在 16.2 节 中 看 到 。 


一 个 伸 归 解 


动态 程序 设计 模式 的 第 二 步 是 依据 各 子 问题 的 最 优 般 来 递归 定义 原 问 题 的 一 个 最 优 解 的 
值 。 对 于 和 矩阵 链 乘法 问题 ， 子 问题 即 确定 AiAij…A; 的 括号 化 的 最 小 代价 的 问题 ， 此 处 1 和 
ji 和 j<n。 设 mi[ij] 为 计算 抢 阵 Ai ; 所 需 的 标量 乘法 运算 次 数 的 最 小 值 ， 计 算 A,, 的 最 小 代价 
怠 是 mtnj]。 

我 们 这 样 来 递归 定义 mil]。 奶 果 i=j， 则 矩阵 链 只 包含 一 个 矩阵 Ai ij= 一 Ai， 故 无 需 和 做 任 
何 标量 乘法 ， 当 然 有 m[ijl=0i= 1.2,… 风 。 当 i<j 时 ， 为 计算 mm[ijl]， 我 们 可 利用 步骤 1 中 
所 刻 划 的 一 种 最 优 解 的 结构 。 假 设 最 优 括号 化 将 乘积 AAAi 从 Ar 号 Al 处 分 开 ，i 和 
k<j。 则 mfij 就 等 于 计算 子 乘积 Aik， 与 At j 的 代价 之 和 加 上 这 两 个 矩阵 相 乘 的 代价 的 
最 小 值 。 因 为 计算 Ai kxAkrij 要 做 pipxpi 次 标量 乘法 ， 则 有 

mpfijl= mfik]Hmfk+1jiHp; UPxDpi 

这 个 递归 方程 假设 了 我 们 已 知 k 的 值 ， 但 实际 上 我 们 并 不 知道 : 我 们 所 知道 的 是 K 有 
和 i 种 可 能 的 值 ， 即 k= ii+l…,i1。 最 优 括号 化 必然 要 用 到 其 中 之 一 的 k 值 ， 故 我 们 可 逐 
个 检查 这 些 秆 ， 以 求 出 最 佳 的 一 个 。 这 样 ， 关 于 对 乘积 AiAi…Ai 的 括号 化 的 最 小 代价 的 
递归 定 沈 为 : . . 
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10 普 i 一 j 
mijj 一 1 ，， | ，，，， . (16.2) 
1 | aaayais 1 十 Pi PPi| 者 i<j 


1 区 j 


各 mlij] 值 给 出 了 子 问 题 的 最 优 解 的 代价 。 为 跟踪 构造 最 优 解 的 过 程 ， 我 们 定义 s[ij] 为 
这 样 一 个 k 的 秆 ， 即 在 该 处 分 裂 乘 积 AliAil…Ai 后 可 得 一 最 优 括 号 化 。 亦 即 ，sba] 等 于 使 
ml=mmfkjHHmik+ljHe prpi 的 伺 。 


计算 录 优 代价 


现在 ， 我 们 可 以 很 容易 地 根据 递归 式 (16.23) 来 写 一 个 计算 素 积 Ai;A…Au 的 最 小 代价 
mf[lm] 的 递归 算法 。 然 而 ， 我 们 将 在 16.2 节 中 看 到 ， 这 个 算法 具有 指数 时 间 ， 这 与 检查 每 一 
种 括 导 化 的 方法 差不多 。 

到 旧 前 为 由 ， 我 们 所 讨论 的 问题 中 的 子 问 题 相 对 来 说 比较 少 : 每 一 对 满足 1 所 i 系 j 委 mn ~ 


的 ;和 j 对 应 一 个 子 问题 ， 总 共 [ Ha= Bon]。 一 个 递归 算法 在 其 递归 树 的 不 同 分 支 中 可 能 


会 光 次 遇 到 同一 个 子 操 题 。 这 种 子 问题 重 秋 性 质 是 动态 程序 设计 的 应 用 的 另 一 个 标志 。 
对 递归 式 (16.2)， 我 们 并 不 去 递归 地 解 它 ， 而 是 热 行动 态 程序 设计 模式 的 第 三 步 并 采用 
自 底 向 上 的 方式 来 计算 最 优 代价 。 在 下 面 伪 代 码 中 ， 我 们 假设 矩阵 Ai; 的 维 数 是 六 - x pu 
ij= 1.2,…m。 输 入 是 个 序列 <popi Pi >， 其 中 length[p]= nfl。 
该 过 程 使 用 了 一 个 辅助 表 m[1..n,1..n] 来 排序 各 mb 代价， 以 及 辐 助 表 s[1..n,1..o] 来 记 
录 计 算 tnfijj 时 取得 最 优 代价 处 k 的 值 ， 
MATRIX-CHAIN-ORDER(D) 
1 ne-iengthip 一 1 


2 forie-ltot 
本 刀口 in 


4 forlzton 

号 do for i*-l] ton 一 中 

折 do ji 计 ] 一 ] 

了 Te 

8 forkK=ito1 

9 do qin[ik]+Hm[k+l 计 Hp-ipupi 
1 于 q<mf] 
11 then m[iji]-- 雪 忆 
12 s[jjj 


13 Teturn tl 当 灼 厅 


该 算法 填 表 m 的 方式 与 解决 按 长 度 递 增 的 矩阵 链 上 的 括号 化 问题 相对 应 。 方 程 (16.2) 说 
明了 计算 一 个 包含 -it1 个 抢 阵 的 矩阵 链 乘 积 的 代价 mij] 仅 依赖 于 计算 包含 少 于 六 if+t 个 拓 
阵 的 矩阵 链 乘 积 的 代价 。 也 就 是 说 ， 对 下 = ii+1 jb 矩阵 Aix 是 ki+1< 广 il 个 媳 阵 的 
乘积 ， 而 矩阵 Al j 是 计 k< 六 it! 个 抢 阵 的 乘积 。 

该 算法 首先 在 第 2-3 行 中 对 i= 12…n 愤 m[iil-0( 长 虚 为 的 链 的 最 小 代价 )。 在 第 
4-12 循环 的 第 一 次 执行 中 ， 利 用 递归 式 (16.3) 来 计算 mlii+IPi= 12…,n-1( 长 度 为 2 的 链 的 
最 小 代价 )。 在 循环 的 第 二 次 执行 中 ， 计 算 mFi+2].i= 1.2…，n-2 长度 为 3 的 链 的 最 小 代 
稚 ), 一 直 继 续 下 去 。 在 每 一 步 中 ， 第 9-12 行 计 算出 的 mfijl 仅 依赖 于 已 经 计算 出 的 表 项 
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mi 和 mfktr1il. 





图 16.1 对 ma=6 及 下 面 各 短 阵 维 数 由 MATRIX-CHAIN-DRDER 计算 出 的 表 mm 和 8 














对 图 中 的 两 张 表 进行 旋转 使 其 主 对 角 线 处 于 水 平方 向 。 在 表 m 中 仅 用 到 了 主 对 角 线 与 上 三 
关 ， 而 袁 s 中 仅 用 到 了 上 三 角 。 六 个 阵 相 乘 所 需 的 标量 素 积 的 最 小 次数 为 m[1. 鲁 =14， 
125。 在 加 了 小 骨 影 的 人 口 项 中 ， 在 第 9 行 中 计算 下 式 时 具有 相同 阴影 程度 的 对 被 放 在 一 
起 : 


mi2.5] = mint m[23] + m[4,5] + pp,p。=2625+ 1000 十 35 .5 20 一 7125 
mi[2,4] + ml[5,5 十 ppP,p。 一 4375 二 0 十 35 .10 .20 一 11375 
一 了 125 
图 16.1 示 出 了 对 包含 n=6 个 失 阵 的 链 该 算法 的 执行 过 程 。 因 为 我 们 仅 对 ji 么 j 定义 了 
m[ijj， 故 表 mm 中 仅 主 对 角 线 以 上 的 部 分 被 用 到 。 该 图 已 将 表 进 行 了 旋转 ， 和 使 对 角 线 星 水 平 
放 警 ， 和 矩阵 链 沿 表 底 部 排列 。 在 这 枕 一 种 安排 中 ， 子 矩阵 链 AiAj…Ai 相 乘 的 最 小 代价 
m[ij] 可 在 经 过 Ai 的 东北 向 的 直线 与 经 过 Ai 的 西北 向 的 直线 的 交点 上 找到 。 表 中 的 每 一 水 
平行 包含 相同 长 度 的 矩阵 链 的 人 口 。 四 
MATRIX-CHAIN-ORDER 日 底 上 地 计算 每 一 行 ， 在 每 一 行 中 又 按照 和 目 左 至 右 的 次 
序 进行 计算 。 一 表 项 mfijj 是 根据 乘积 p_ipxpikk=ii+1l…y 一 3 与 所 有 穿 过 mlig 的 西南 向 与 
东南 向 的 表 项 计算 削 来 的 。 
MATRIX-CHAIN-ORDER 具有 撤 套 循环 结构 , 其 运行 时 间 为 On?)。 循 环 的 骨 套 层 
数 为 三 层 、 每 一 屋 循环 的 下 标 (bi 和 菇 可 取 至 多 n 个 值 。 
练习 16.1--3 要 求 读者 证 明 这 个 算法 的 运行 时 间 实 际 上 为 Rn )。 另 外 ， 该 算法 还 需要 
”@(o9 的 空间 来 存储 表 m 和 8。 这 样 ，MATRIX-CHAIN-ORDER 就 远 较 校 举 各 种 可 能 的 


[ea +m[3, 引 +p pp, =0+2500+35 .15 .20 一 13000 
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括号 化 的 指数 时 间 方 法 为 有 效 。 
构造 量 优 解 


MATRIX-CHAIN-ORDER 确定 了 计算 矩阵 链 乘积 所 需 的 最 优 标量 乘法 次 数 ， 但 它 
溅 有 直接 说 明 如 何 对 这 些 矩 阵 进 行 相 乘 。 动 态 程 序 设 计 模 式 的 第 4 步 即 给 出 了 从 已 计算 出 的 
局 息 来 构造 一 个 最 优 解 的 方法 . 
在 我 们 的 例子 中 ， 我 们 利用 表 引 1..n,1..o 来 确定 矩阵 相 乘 的 最 佳 方式 。 每 一 表 项 s6 避 记 
录 了 对 乘积 AlAl…Ai 在 Ak 与 Ar 之 问 进 行 分 型 以 取得 最 优 括 号 化 时 的 k 值 。 由 此 可 
知 ， 按 最 佳 方式 计算 Ai ,的 最 终 吹 序 为 Al JJAJior as 该 式 中 在 前 面 做 的 先 阵 飞 法 可 递 
归 地 进行 ， 因 为 sllsflol 确 定 了 计算 Ai na 中 的 最 后 的 矩阵 乘法 ， 而 s[s[Lal+ba] 则 确定 了 
计算 Au ur。 中 最 后 的 矩阵 运算 。 下 面 的 递归 过 程 在 给 定 了 矩阵 A= <AuA>…,As>i 由 
MATRIX-CHAIN-ORDER 计算 出 的 表 s， 和 下 标 ji 与 j 后 计算 出 矩阵 链 乘 积 Ai。 初 始 
调用 为 MATRIX-CHAIN-MULTIPLY(A,s,1n)。 
MATRIX-CHATN-MULTIPLY(A:siD) 
1 ,证 1>1 
之 本 X<RMATRIX 一 CHAITN 一 MULIIPELYIL(As.is[i 
3 YNMATRIX-CHAIN-MVLTIIPLYLA.ssTi:i+r1i) 
十 return MATRH-MULTIPLYIX,Y) 
3 esSe Tetfara 各; 
”在 图 16.1 的 例子 中 ,过 程 油 用 MATRIX-CHAIN-MULTIPLY(A,s,1.6) 按 括号 化 
((Ai(A2A3)NKCA4A5AG) 【16.3) 
来 计算 矩阵 链 乘 积 。 


16.2 ”动态 程序 设计 基础 


我 们 同 刚 讨论 过 动态 程序 设计 方法 的 一 个 例子 ， 现 在 来 看 看 什么 时 候 应 用 这 个 方法 。 从 
工程 的 角度 看 ， 对 一 个 具体 问题 ， 我 们 在 什么 样 的 情况 下 需要 有 一 个 动态 程序 设计 解 ? 在 这 
一 节 里 ， 我 们 要 介绍 适合 采用 汉 态 程序 设计 方法 的 最 优化 问题 中 药 两 个 有 要素: 最 优 结构 和 重 
友子 问题 。 我 们 还 要 讨论 另 一 个 称 作 记忆 化 的 方法 ， 以 充分 利用 重 瑟 子 问题 性 原 ， 


最 优 结构 


用 动态 程序 设计 方法 来 解决 一 个 问题 的 第 一 步 是 刻 划 一 个 最 优 解 的 结构 。 我 们 说 一 个 问 
题 具 有 最 优 子 结构 ， 如 果 该 问题 的 最 优 解 中 包含 了 子 问 题 的 最 优 解 。 当 一 个 问题 呈现 出 最 优 
子 结构 时 ， 动 态 程序 设计 可 能 就 是 一 个 合适 的 余 选 方法 了 { 侦 心 策略 也 通 合 于 这 种 问题 ， 饮 
第 十 七 章 )}.。 

在 16.1 节 里 ， 我 们 发 现 和 矩阵 链 乘 法 问题 具有 最 优 子 结构 。 具 体 来 ， 对 AiA2z… 和 从 
A 与 At 处 分 开 的 最 优 括号 化 中 包 售 了 对 子 问题 AAA 的 括号 化 和 AnAta…Au 的 撕 
号 化 的 最 优 艇 。 用 来 说 明子 问题 具有 最 优 解 的 技术 是 很 典 烈 的 。 我 们 先 假 设 子 问题 有 一 个 更 
好 的 解 ， 再 证 明 这 个 假设 与 原 问题 解 的 最 优 性 的 了 矛盾. 
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_ 个 问题 的 最 优 子 结构 常常 暗示 了 可 应 用 动态 程序 设计 方法 的 一 个 子 问题 空间 。 典 型 情 
况 是 ， 某 一 特定 问题 可 有 几 类 “自然 的 " 子 问题 。 例 如 ， 移 阵 链 滋 法 的 子 问题 空间 包含 了 输 人 
链 的 所 有 子 链 。 我 们 本 来 也 可 以 选择 由 输入 链 中 任意 的 矩 降序 列 构成 的 子 问题 空间 ， 但 这 个 
灾 间 太 大 了 ， 基 于 这 样 一 个 子 问题 空间 的 动态 程序 设计 算法 要 多 解 许多 不 必要 的 问题 。 

找 出 合适 的 动态 程序 设计 的 子 问题 空间 的 一 个 好 方法 是 通过 对 子 问题 实例 的 释 代 来 考察 
-个 问题 的 最 优 子 结构 。 例 如 ， 在 看 了 矩阵 链 问 题 的 一 个 最 优 解 的 结构 后 ， 我 们 可 以 不 断 合 
代 以 考察 子 问题 ， 子 子 问题 ，… 最 优 解 的 结 梅 。 我 们 发 现 ， 所 有 子 问 题 都 包含 子 链 <Au， 
A,，.…，A_> 。 这样， 所 有 形 如 <Ai.Alu…,Aj> 的 链 构成 的 集合 就 是 一 个 自然 和 合理 的 子 
问题 空间 . 


罩 寿 子 问题 


适合 于 动态 程序 设计 方法 解决 的 最 优化 问题 必须 具有 的 第 二 个 要 素 是 子 阿 题 空间 要 "很 
小 "， 也 就 是 用 来 解 原 问 题 的 一 个 递归 算法 可 反复 地 解 同 样 的 子 问 题 ， 而 不 是 总 在 产生 新 的 
子 问 题 。 典 型 地 ， 不 同 的 子 问 题 数 是 输 人 规模 的 一 个 多 项 式 。 当 一 个 递归 算法 不 断 地 遇 到 
同一 疝 题 时 ,. 我 们 说 该 最 优化 问题 包 食 有 重 释 子 问 题 。 相 反 地 ， 适合 用 分 治 法 解雇 的 问题 往 
往 在 遂 归 的 每 一 一步 都 产生 出 全 新 的 问题 来 。 动 态 程序 设计 方法 总 是 充分 利用 重 香 子 问题 ， 对 
每 个 子 问题 只 解 一 次 ， 把 解放 在 一 个 在 需要 时 就 可 查看 的 表 中 ， 而 每 一 一 次 查 表 的 时 间 为 灌 
数 . 

为 说 明 重 春子 问题 性 质 ， 让 我 们 来 重 看 一 下 和 邱 阵 链 乘 法 问题 。 回顾 一 下 图 16.1，MA- 
TRIX_CHAIN-ORDER 在 解 较 高 行 中 子 问题 时 要 反复 查看 较 低 行 中 子 问题 的 解 。 例 如 ， 
表 项 mm[3.4] 被 引用 了 4 次 : 在 计算 m[2.4],mf[1,4].m[3,.3 和 m[3, 扣 中 被 引用 如 果 m[3.4] 每 次 
都 要 被 重新 计算 ， 则 所 增加 的 运行 时 间 是 相当 多 的 。 为 搞 清 楚 这 一 点 ， 考虑 十 面 确定 锯 划 j] 
的 低 效 的 递归 算法 。 该 过 程 直接 基于 递归 式 (16.21: 

RECURSIVE-MATRIX-CHAINICP:i) 
1 ifi=j 
tbhen _ return 省 
m[ijj< 一 ce 
fork< itoj 一 上 
由 q<-RECURSIVE-MATBIX-CHAIN(P,it)+ 
RECURSIVE-MATRIX-CHAINIP 上 +1j)+Pp pepi 
白 让 忆 < im[ijjj] 
then in[ 过 | 一 9 
8 return mfijl 

图 16.2 示 出 了 由 调用 RECURSIVE-MATRIX-CHAINC,1,4) 所 产生 的 递归 日 树 ， 每 个 
节点 上 都 标 有 参数 1 和 j 的 值 。 请 注意 某 些 值 对 出 现 了 多 次 。 每 个 节点 包含 参数 i 和 j。 在 加 
了 阴影 的 子 树 中 所 做 的 计算 可 用 MEMORIZED-MATRHX-CHAIN(P，1，4) 中 的 一 次 
查 表 代 替 。 

事实 上 ， 我 们 可 证 明 由 此 递归 过 程 来 计算 m[ln] 的 运行 时 间 Tn) 至 少 为 翼 的 指数 .已 


设 涩 行 尝 中 1 和 6 一 7 行 都 至 少 花 单 位 时 间 。 分 析 该 过 程 可 得 递归 式 
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nm 一 1 


TD>1+> TO+TO 一 匡 +D，n>1 


竺 一 电 


注意 对 i= 12… 间 一 1， 每 一 项 TG) 一 次 是 作为 TQG 出 现 ， 另 一 次 是 作为 TO 一切 出 
现 。 该 递归 式 可 被 重 写 为 


TD222》 Ti 二 nn (16.4) 


我 们 将 用 替换 方法 来 证 明 'Tn] = 9t2 )。 具 体 地 ， 我 们 将 证 明 对 所 有 nz 1， 有 T(n) 
> 2"” 。 基 础 很 容易 证 明 ， 因 为 TCD zz1= 人 2 关 。 对 mez2 有 


1 一 】 


T(n) 关 2 了 2 十 了 


一 2 有 2 + 十 nn 


=22 一 四 + 
=(2 一 轨 +n 
学 20: 
结论 得 证 。 所 以 ， 调 用 RECURSIVE-MATRIX-CHAINGP:1) 的 总 代价 至 少 为 m 的 
指数 。 


有 一 | 


] .4 


33 44 22 33 22 33 1 2.2 
图 16.2 ”计算 RECURNSIVE--MATRIX-CHAINP，1，4) 时 的 递归 树 
二 


请 谈 考 将 这 个 自 项 向 下 的 递归 算 水 与 目 底 向 上 的 动态 程序 设计 算法 作 个 比较 。 可 以 看 
出 ， 后 者 更 为 有 效 ， 因 为 它 利用 了 重 释 子 问 题 性 质 ， 不 同 的 子 问 题 共 有 @(o”) 个 ;动态 程序 设 
计算 法 对 每 一 个 只 解 一 容 ， 而 上 面 的 递归 算法 对 在 递归 树 中 重复 出 现 的 每 个 子 问 题 都 要 重复 
解 一 次 。 当 某 个 问题 的 递归 树 中 反复 包含 同一 个 子 阿 题 ， 且 不 同 的 子 问题 数 很 小 时 ， 可 以 考 
虑 长 否 能 用 动态 程序 设计 方法 来 解 这 个 问题 。 


记忆 化 
动态 程序 设计 方法 有 一 种 变形 ， 它 既 具有 通常 的 动态 程序 设计 途径 的 效率 ， 又 采用 了 一 
种 自 顶 向 下 的 策略 。 其 思想 是 记忆 原 问 题 的 自然 但 低 效 的 递归 算法 。 像 在 通常 的 动态 程序 设 
计 方 法 中 一 样 ， 我 们 维护 一 张 子 问题 解 表 ， 但 有 关 填 表 动 作 的 控制 结构 更 像 递 归 算法 . 
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一 个 记忆 的 递归 算法 为 每 个 子 问题 的 解 在 表 中 记录 一 个 表 项 。 开 始 时 每 个 表 个 表 项 都 包 
含 一 个 特殊 的 值 ， 以 未 该 表 项 有 待 填 人 。 当 在 递归 算法 的 技 行 中 第 一 次 遇 到 一 个 子 问 题 时 ， 
计算 其 解 并 填 人 表 中 。 以 后 每 次 遂 到 该 子 问题 时 ， 只 要 查看 表 中 先前 填 人 的 值 即 可 。 

下 面 的 过 程 是 及 ECURSIVE-MATRHX-CHAIN 的 记忆 化 版 本 : 


MEMORIZED-MATRIX-CHAIN(p) 
1 nength[p] 一 1 
fofr 说-l to 荆 
do forj*-i ton 
do mijj< 一 ce 


了 
3 
引 
5 return LOODOKUP-CHAINIP:1D) 


LOOKUE-CHAITNCP:i 

1 这 训 [ij] 天 se 

2 then yeturna mm[ij] 

3 记 i=j 

入 then mm 三 ,jj 一 眉 

5 else for ks-i to jl 

厂 do q<-LODKUP-CHAINLP + 
LOOKUP-CHAIN(p,k+1 有 HP pupi 

? 证 9<mmbj] 

虽 then tm[j,jj- 一 纪 

9 return mh 上,j] 


”和 橡 MATRIX-CHAIN-ORPER 一 样 ，MEMORIZED-MATRIX-CHAIN 对 计算 出 
的 infi] 值 (为 计算 矩阵 A, ; 所 需 的 标量 乘法 的 最 少 次 数 ) 维 护 一 张 表 m[1..n,1.. 四 。 每 个 表 项 
初始 .时 包含 值 c<=， 以 示 该 表 项 有 待 于 填 人 。 当 执行 调用 LOOKUP-CHAIN(p,ij 时 ， 在 第 1 
行 中 如 果 mfbij<ce， 则 该 过 程 就 返回 先前 计算 出 的 代价 m[ijl( 第 2 行 ) 和 朱 则 ， 如 在 
RECURSIVE-MATRIX-CHAIN 中 一 样 计 算 人 代价， 存在 m[ijl] 中 ， 然 后 返回 。 这 样 ， 
LOOKEUP-CHAINC ij) 总 是 返回 值 mijl， 但 是 仅 当 该 过 程 是 第 一 次 以 参数 i1 和 j 调用 时 才 “ 
计算 这 个 值 。 四 

图 16.2 说 明了 MEMORIZED-MATRIX-CHAIN 是 如 何 较 RECURSIVE--MA- 
TRIX-CHAIN 节省 时 间 的 。 骨 影 部 尔 的 子 树 表 示 被 查看 (而 不 是 被 计算 的 ) 值 。 

像 动态 程序 设计 算法 MATRIX-CHAIN-ORDER 一 样 ， 过 程 MEMORIZED- MA- 
TRIX- CHAIN 的 运行 时 间 为 DOn )。 癌 (ao) 个 表 项 中 的 每 一 个 都 由 MEMORIZED-~ MA- 
TRIX- CHAIN 中 第 4 行进 行 一 次 初始 化 ， 并 由 对 LOOKUP- CHAIN 的 一 次 调用 填充 。 
对 LOOKUP- CHAIN 的 "Bo 次 调用 中 的 每 一 次 的 时 间 都 为 D(m)， 不 包括 计算 其 他 表 项 
的 时 间 ， 则 总 的 时 间 代 价 为 Dtn3J。 由 此 可 见 ， 记 忆 技 术 将 一 个 Q(29 算 法 变 成 了 一 个 Do) 
算法 。 

闪 之 ， 答 阵 链 乘 法 问题 可 用 自 顶 向 下 的 记忆 化 算法 或 自 底 向 上 的 动态 程序 设计 算法 在 
On?) 时 间 内 解决 。 两 种 方法 都 利用 了 重 亚 子 问题 性 质 。 原 问题 共有 @@(o”) 个 不 同 的 子 问题 ， 
这 两 种 方法 人 都 只 对 每 个 子 问 题 计算 一 殉 。 如 果 不 用 记忆 化 技术 的 话 。 自 然 递 归 算法 就 要 以 
指数 时 间 运 行 ， 因 为 它 要 反复 解 已 解 过 的 问题 。 
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在 实际 应 用 中 ， 如 果 所 有 的 子 问题 都 至 少 要 被 计算 一 次 ， 则 一 个 自 底 向 上 的 动态 程序 设 
计算 法 就 要 比 一 个 自 顶 向 下 的 记忆 化 算法 好 出 一 个 常数 因子 ， 这 是 因为 前 者 无 需 递 归 的 代 
价 ， 旦 维护 表 的 开销 也 要 小 些 。 在 有 些 问 题 中 ， 还 可 利用 动态 程序 设计 中 的 表 存 取 模 式 来 进 
一步 减 少时 间或 空间 上 的 要 求 。 对 子 问题 空间 中 有 某 些 子 问 题 根本 无 需 解 的 情况 ， 记 忆 化 方 
法 有 着 只 解 那些 肯定 要 解 的 子 问题 的 优点 。 


16.3 ”最 长 公共 子 序 列 


我 们 要 考虑 的 下 一 个 问题 就 是 最 长 公共 子 序列 问题 。 一 个 给 定 序列 的 某 个 子 序列 即 给 定 
的 序列 再 去 掉 岂 个 元 素 ( 可 能 一 个 也 不 去 掉 }。 亦 即 ， 给 定 一 序列 刁 = <XX2mXm>， 另 一 
序列 Z= <zz 国 > 是 的 子 序列 ,如 果 存 在 X 的 一 个 严格 递增 下 标 序 列 <ibiz… 让 > 使 
得 对 所 有 的 j = 1,2,… :上 ， 有 xi 一 zz 。 例 如 ，z= <B:C:D,B> 就 是 和 = < 上 ABC,B. ID 入 , 晶 > 


”的 一 个 子 序列 ， 相应 的 下 标 序列 为 <<2.3,5, 了 > 。 
给 定 两 个 序列 X 和 立 ， 称 序列 Z 是 X 和 站 的 公共 子 序列 ， 如 果 Z 既 是 的 一 个 子 序 

列 又 是 平 的 一 个 子 序 列 。 例 如 ， 如 果 X= <A,BC.D,AB>T 了 = <B.D'CA,BA>， 则 序列 
<B,C,A> 即 为 和 Y 的 一 个 公共 子 序列 ， 但 不 是 买 和 并 的 最 长 公共 子 译 列 (LCS)， 因 为 
还 有 比 它 更 长 的 公共 子 序 列 <BC:B,A>。< 了 BC.B'A> 是 和 和 了 的 一 个 LCS, 序 列 
< 了 HB 了 DA, 卫 > 也是。 

在 最 长 公共 子 序 列 回 题 中 ， 给 定 了 两 个 序列 芙 = <XX2>> 和 和 = <Yiy2 yo>， 

要 求 出 和 立 的 最 大 长 度 公 共 子 序列 。 这 一 节 说 明了 LCS 问题 可 用 动态 程序 设计 方法 来 有 
效 地 解决 。 


对 最 长 公共 子 序 列 进行 耘 划 


解 快 LCS 问题 的 一 种 方法 是 列举 出 X 的 所 有 子 序 列 ， 一 一 检查 看 其 是 否 是 立 的 于 序 
列 ， 并 靖 时 记录 下 所 发 现 的 最 长 子 序列 。X 的 每 个 子 序列 对 应 于 其 的 下 标 集 iL2…m] 的 一 
个 子 集 .和 共有 2 种 子 序列 ， 故 这 种 途径 需要 指数 时 间 代 价 ， 这 对 长 序列 来 说 是 不 实际 
的 | 国 

然而 ，LCS 问题 有 着 最 优 子 结构 性 质 ， 王 面 的 定理 说 明了 这 一 点 。 我 们 将 看 到 ， 自 然 
的 子 问 题 类 与 下 个 输 人 序列 的 "前 ? 对 对 应 。 准 和 确 地 说 ， 给 定 一 个 序列 入 = <Ra 
>， 对 i=01… 加 定义 X 的 第 i 个 前 统 为 砚 = <xoxm… >， 例如， 如 果 
X= <A,BCB.D,A.B>， 则 X= <A,BiCJB> ， 币 Xo 则 为 空 序列 。 

定理 16.1(LCS 的 最 优 子 结 档 ) 设 和 = <xuxomxu> 和 立 = <ybyoyo> 为 两 个 序列 ， 
并 设 Z= <zyzomp 了 > 为 X 和 立 的 LCS。 
于吉 果 x =y 则 五 =X 一 TY 且 P 是 X。 和 Yi 的 一 个 LCS。 

2. 如 果 志 关 y ， 则 二 X。 蕴含 Z 是 X。 和 Y 的 一 个 LCS。 

3. 如 果 x 关 7 ， 则 乙 -Y, 区 售 是 X 和 下 的 一 个 LCS。 

证 最: (TD 好 果 乙 寺 X ， 则 我 们 可 将 其。= Yu。 拼接 到 己 上 以 获得 广 和 立 的 一 个 长 度 为 
k+l 的 公共 子 序列 。 这 与 Z 是 和 和 立 的 最 长 公共 子 序 的 假设 矛盾 。 这 样 ， 必 有 
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Z.=Xn=Yu， 而 前 组 乙 _， 则 为 X。 | 和 站, 的 长 度 为 (kt-1) 的 公共 子 序列 。 我 们 希望 证 明 
它 是 一 个 LCS。 为 了 引出 将 层 。 假 设 X | 和 立 ， 有 一 个 长 度 大 于 k-1 的 公共 子 序 列 如 
那么 ， 将 Xn=Yu 拼接 到 W 上 就 会 产生 X 和 立 的 一 个 长 度 大 于 k 的 公共 子 摩 列 ， ,得 矛 
居 . 

(2) 如 果 ZXuw， 则 工 是 Z 和 Y 的 一 个 公共 子 序列 。 如 果 X 和 立 有 一 个 长 度 天 
于 站 的 公共 子 序列 妈 ， 则 到 也 应 该 是 X 和 Y 立 的 一 个 公共 子 序列 ， 这 与 Z 为 式 和 立 的 
LCS 的 假设 矛盾 。 

G) 的 证 明 与 (2) 的 证 明 对 称 。( 证 毕 ) 

定理 16.1 说 明了 两 个 序列 的 一 个 LCS 也 包含 了 两 个 序列 的 前 级 的 一 个 LCS。 这 就 说 明 ， 
了 LCS 问题 具有 最 优 子 结构 性 质 。 过 一 会 我 们 将 刹 到 ， 一 个 递归 和 解 还 具有 重 秋子 问题 竹 
质 。 


子 问题 的 递归 解 


由 年 理 16.1 可 知 ， 在 找 式 = <Xox…xa> 和 T= <Wy2p7> 的 一 个 LCS 时 ,可 能 莫 
检查 一 个 或 两 个 子 回 题 、 如 果 Xn=Y， 我 们 就 要 找 出 X ,和 立 | 的 一 个 LCS。 将 
Xu 一 Y 拼接 到 这 个 LCS 上 就 产生 X 冬 的 一 个 LCS。 如 果 Xun-Yu， 我 们 就 要 解决 两 个 
子 问 题 : 找 出 zw- 和 芷 的 一 个 LCS， 和 和 找 出 X 与 阅 _, 的 一 个 LCS。 取 这 两 者 中 较 长 者 作 
为 式 和 YY 的 LCS. 

在 LCS 问题 中 很 容易 看 到 重 画 子 问题 性 质 。 为 找 出 X 和 YY 的 一 个 LCS， 我 们 可 能 需 
要 萄 和 Yi 的 LCS 与 Xe 和 立 的 LCS。 这 两 个 子 问题 都 包含 状 找 X ,和 立 的 
LCS 的 子 子 问 题 。 还 有 许多 其 他 的 子 问题 都 具有 公共 子 子 问题 。 

像 矩 阵 链 乘 法 问题 一 样 ，LCS 问题 的 递归 解 牵涉 到 确立 -一 个 最 优 解 的 代价 的 递归 式 的 
问题 。 我 们 定义 cdj] 为 序列 Xi 和 Yi; 的 一 个 LCS 的 长 度 。 如 果 i=0 或 者 j=0， 亦 即 两 个 序 
剂 之 一 的 长 度 为 0， 则 LCS 的 长 度 也 必 为 0。 直 LCS 向 题 的 最 优 子 结构 可 得 递 时 式 ， 


0 若 i = 0 或 j =0 
cjj] = ci 一 ij 一 可 +1 若 刘 > 和， 县 xi 一 2 人 6.5) 
Imax(c[ 这 一 icfi 一 了 著 评 > 0。， 上 县 X， 关 y， 
计算 CS 的 长 度 


根据 (16.3 式 ， 我 们 可 以 很 容易 地 写 出 一 个 指数 时 间 算 法 来 计算 两 个 序列 的 一 个 LCS 的 
长 谋 。 朵 为 只 有 @(tmm 个 不 则 的 子 问 题 ， 我 们 可 用 动态 程序 设计 的 方法 自 底 向 上 地 计算 出 
解 来 。 

过 程 LCS-LENGTH 以 两 个 序列 其 一 女 par 和 7 为 输入 ， 并 
洗 Sij 值 填 人 一 个 按 行 计 算 表 项 的 表 ci0.m,0.n] 中 ( 亦 拖 ,ec 的 第 -- 行 自 左 至 右 地 十 人 。 然 后 
是 第 二 行 ， 等 等 )。 它 还 用 到 表 bl..m,1.o] 以 简化 最 优 解 的 构造 过 程 。 从 直觉 上 看 ，bfij] 指 
癌 与 在 计算 [ij] 时 所 选择 的 最 优 子 问题 的 解 对 应 的 表 项 。 该 过 程 返回 表 和 表 ci clman] 中 
包 售 xx 和 立 的 一 个 LCS 的 长 度 ， 
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DT23435 6 
1 8 和 
0 中 副 串 时 
1 有 
2 月 风 虽 | 
3 的 几 | 
4 8 中 
3 了 | 引 引 
6 有 1 人 外 改 生 
?7 4 让 时 | 





疼 16.3 在 序列 X= <A.B,C.B,D,A.B> 与 Y= <BD,CAJB,A> 上 由 LCS-LENGTH 计算 的 表 c 和 


工人 CS-LENGTIHIX,Y) 

1 in<lengthfX] 

2 1<- 近 ngthfY] 

了 fr iv to 各 

二 tb esojM0 

3 forj1tonn 

各 do cmjhF0 

7 fori1to mn 

避 qdo Forjs-l toa 

9 do 计 交 一切 
10 then cfijle-cFi 一 1 一 1DHi 
11 bijl< > 
12 else 记 o 一 上 少 关 吕 i 语 
13 世 cn cfijjs 6 一 1] 
14 bijle” 二” 
15 else oj-cDii 一 世 
16 < 


17 Feturna CC anod hb 


图 16.3 给 出 了 在 输 人 序列 = < 各 ， 哩 ，C，B， 了 PP，A， 了 > 和 立 = <3，D，C， 和 A， 
B，A> 上 LCS-LENGTH 所 产生 的 表 c 和 b。 在 第 i 行 和 第 j 列 中 的 方块 包 省 cli，j 的 值 . 
及 指向 bfi，j 的 箭头 。 在 以 7， 辐 中 的 人 品 4 一 表 的 右 下 角 - 一 一 为 藉 和 Y 立 的 一 个 LCS<B， 
C，B，A> 的 长 度 ， 对 j>0， 人 人口 Ci，j] 仅 依赖 于 是 否 有 一 态 及 人 日 中 -1，j，oi， 
入 ] 与 中 -1， 放 旺 中 的 值 ， 这 几 个 人 口 都 在 上 中，i 之 前 计算 。 为 了 重 构 一 个 LCS 的 元 素 ， 从 
右 下 角 开 始 跟 由 bi，jj 篇 头 即 可 。 这 条 路 径 上 的 每 个 沁 "与 一 个 使 怒 = 芒 为 一 个 LCS 的 成 
员 的 人 口 对 度 。 这 个 过 程 的 运行 时 间 为 O(mn)}, 因 为 计算 每 个 表 项 的 时 间 为 DI1)。 


构造 一 个 CS 


由 LCS-LENGTH 返 团 的 表 b 可 被 用 来 快速 构造 X= <x，z，…，zm> 和 
.，. 四 -一 2] 4 一 一 


衬 = < yy 加 > 的 一 个 LCS， 方 法 是 从 bima 处 开始 六 箭头 中 中 下去。 每 当 我 们 在 
并 项 Hi， 有 中 过 到 一 个 所 “时 ， 它 意味 着 xi 一 yj 是 ELCS 的 一 全 元素。 这 种 广 法 是 按 反 序 来 
找 LCS 的 每 一 个 元 束 的 。 王 商 的 递归 过 程 接 正 常 的 次 序 邱 出 和 站 的 -一 个 LCS， 初 始 
用 为 ， 
PRINT-LCS(b，X，length[XjlengthfYT)。 


PRINT 一 ICSfb, Xi 
1 于 = 站 or = 站 

2 then returt 

3 这 bfijj= 和 从 

4 钊 en 了 下 INT 一 LCSLb,X,i-1 -1) 
3 Print 其 

在 Else 这 blijj 一 ”站 

7 then PRINT--LCSCbXji-1j) 
8 else 了 RNNT-ELCSCbP: 其 4 一 孔 


对 图 16.3 中 的 表 b， 这 个 过 程 印 出 "BCBA“。 固 为 在 递归 的 狂 阶 段 中 i 各 j 至 少 有 一 个 
蓝 减 小 ， 故 该 过 程 的 运行 时 间 为 Otm+o)。 


对 代码 的 改进 


一 旦 引 计 出 了 某 个 算法 之 后 ， 常 常 能 从 时 间或 空间 上 对 该 算法 作 些 改进 。 对 动态 程度 设 
计算 法 九 其 如 此 。 有 了 时候 作 了 某 些 改变 可 简化 代码 并 改进 一 些 常数 因子 ;有 时 候 作 了 另 一 些 
改变 则 可 在 时 室 代 价 上 有 很 大 的 ， 渐 近 意 义 上 的 节省 。 

例如 ， 我 们 可 以 完全 去 掉 表 b。 每 个 表 项 eli，j 仅 依赖 于 另 三 个 e 甫 项 ，chi-1j 一 1 
ci 一 1 和 扣 ， 放 本 。 给 定 ci 的 值 ， 我 位 可 在 DGbD 时 间 内 确定 用 这 兰 个 值 中 的 蔚 一 个 来 计 
算 cli，jj， 而 不 用 检查 表 b。 这 样 ， 我 们 能 利用 一 个 类 似 于 PRINT-LCS 的 过 程 在 DUm+fn) 
时 间 内 重 构 一 个 LCS( 练 习 16.3-2 要 求 你 写 出 该 过 程 的 伪 代 码 )。 虽 然 我 们 用 这 种 方法 节省 
了 色 mn) 空 间 ， 但 计算 一 个 LCS 时 所 要 求 的 辅 朋 空 间 并 设 有 疡 近 地 碱 少 ， 因 为 5 开 总 是 强 
占据 马 (maj 空 间 的 。 . 

然而 ， 我 们 能 减少 LCS-LENGTH 渐 近 空间 吏 求 ， 国 为 它 次 岂 知 表 e 的 商行， 正在 
被 计算 的 一 行 与 其 前 一 行 (实际 上 ， 我 们 仅 需 略 客 于 表 ec 一行 的 空间 就 可 计算 个 LCS 了 、 
见 练习 16.3-4， 如 果 仅 要求 出 一 全 LCS 的 长 度 则 这 种 改进 是 有 用 的 ; 如 果 我 的 要 让 构 …- 个 
LCS 的 元 素 ， 则 小 表 无 法 包含 足够 的 信息 求 使 我 们 在 Oomn+o 时 间 央 重复 以 前 各 步 。 


16.4 最 优 多 边 形 三 角 剂 分 


这 一 节 里 ， 我 们 要 讨论 对 一 个 凸 多 边 形 佑 最 优 沽 角 蛮 分 的 问题 。 我 们 将 看 到 ， 这 个 正 何 
问题 与 皇 阵 乘法 问题 表面 上 君 虽 没 有 什么 关系 ， 实 际 上 却 有 着 很 强 的 相似 之 处 。 

一 个 多 边 形 是 绊 面 上 的 一 个 分 段 线性 的 ， 闭 的 曲线 。 亦 即 ， 它 是 由 一 个 直线 用 (《 称 为 多 
进 形 的 进 ) 的 序列 构成 的 自封 闭 曲线 。 连 接 两 条 连续 的 边 的 点 称 为 多 边 形 的 项 点 。 如 果 多 边 
形 大 简单 的 (我 们 后 面 一 般 都 要 作 此 假设 )， 峙 它 自 身 不 会 相交 。 平 面 上 由 一 个 简 间 多边 形 
所 曾 住 的 所 有 点 的 集合 构 成 了 该 和 多边形 的 内 部 ， 多 边 形 上 的 所 有 点 的 集合 构成 其 形 的 外 部 ， 
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一 个 简单 和 多边形 是 凸 的 ， 如 果 绘 定 其 边界 上 吉 汉 部 的 任意 隔 个 点 ， 则 这 两 点 连 线 上 的 所 有 点 
都 在 边界 上 或 内 部 。- 
我 访 训 通过 蒂 逆 时 针 方 癌 列 则 所 有 顶 电 的 方式 来 表示 一 个 凸 多 过 形 。 亦 邵 ， 如 果 于 = 
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<yYi， Vi， …，Y |i> 是 个 凸 多 过 形 ， 它 有 了 条 边 Vuv ， vv mvV_iIY， 其 中 v 基 


] ] 了 训 一 1 玫 
为 v,。 《一 般 来 说， 我 们 隐 式 地 假定 有 关 顶 点 下 标的 算术 运算 都 玫 对 质点 个 数 取 烧 。) 

给 定 两 个 不 相 邻 的 顶点 v, 和 v| ， 线 段 vi 为 多 边 形 的 苞 。 一 . 根 络 vivi 将 多 边 形 划 分 成 
两 个 多 过 形 : <v，Y  ， ， Vi > 和 <Vi vi 凡 >。， 某 一 多 边 形 的 一 个 三 角 齐 
分 是 由 将 该 铭 迎 形 划分 成 不 相交 的 码 角 形 【只 有 三 边 的 多边 形 ) 的 所 有 寺村 成 的 集合 丁 。 
图 16.4 示 出 了 对 一 个 七 按 多 壹 形 的 两 种 二 角 前 分 。 每 一 种 三 蕴 部 分 都 有 了 一 3= 一 4 根 荡 ， 并 
拒 该 七 边 形 好 分 成 7 一 2=5 个 寺 角 形 。 在 一 个 三 第 前 分 中 ， 所 有 的 蓄 都 不 相交 〈 内 了 在 站 
的 奖 点 之 外 】 ， 且 芝 的 集合 T 是 最 大 药 : 每 一 根 不 在 了 中 的 引 都 驱 与 T 中 的 某 根 续 相 交 。 
由 工 朋 前 分 所 产生 的 三 角形 的 特 按 或 是 三 稍 裔 分 中 的 纺 ， 或 是 多 边 形 的 边 。 对 一 包含 nm 个 
项 点 的 凸 窗 边 形 的 每 一 种 二 角 削 分 帮 有 na 一 了 了 根 纺 ， 并 将 和 多边形 划分 为 nm 一 2 个 拓 贡 形 。 





(3) 各 
赂 16.4 对 一 个 凸 多 迪 形 的 两 种 尖 前 前 分 


在 最 优 { 多 地形 ) 三 角 放 分 问题 中 ， 已 知 的 是 一 个 上 四 驳 边 形 P= <vw mw > 和 
一 个 定义 在 由 边 和 了 的 纺 攀 成 的 三 角形 上 的 权 函 数 中， 要 求 出 一 个 三 角 剂 分， 使 得 所 产生 
的 所 有 三 角形 的 权 之 和 最 小 ， 我 们 很 自然 他 会 想到 的 -一 个 权 函 数 是 : 
(viviyi 由 一 waivj| 十 vv 十 人 vi| 


其 中 jy,y| 是 w 和 间 的 欧 几 里 德 距 离 。 我 们 将 要 给 出 的 算法 对 任意 饮 择 的 权 函 数 都 适 
用 。 
-与 括号 化 的 对 应 
在 多 边 形 的 三 角 剖 分 和 对 表达 式 的 括号 化 之 问 存在 着 一 种 惊人 的 对 应 。 这 种 对 应 可 用 树 
一 个 表达 趟 的 全 括号 化 对 应 于 -要 清二 到 条 (有 时 也 太 称 为 该 玫 过 式 的 分 新 李 )， 在 图 
16.5 中 ， 人 @) 示 出 了 下 面 揪 号 化 的 矩阵 链 委 积 的 : 
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(A (AAALA,A 访 (16.6) 
人 括号 化 委 积 ( (A，(A)A,) ) (A，(A,jA,) ) ) 以 及 对 图 16.4 (a) 中 包 会 七 
条 边 的 多 边 形 所 做 的 三 角 前 分 的 分 析 树 。 《bj 该 多 边 形 的 覆盖 了 分 析 树 的 三 角 剂 分。 每 个 


re 


矩阵 Ai 对 应 于 边 y Y ，j= 1I，2，…，6 分 析 树 中 的 每 个 时 节点 都 标 以 表达 式 中 的 一 个 
基本 元 素 ( 矩阵 )。 如 果 某 棵 子 树 的 根 有 左 子 树 表示 一 表达 式 B,， 又 有 右 子 树 表示 一 表达 
式 E ， 则 该 子 树 本 身 就 表示 表达 式 (E,E.)。 在 分 析 树 和 含 n 个 基本 元 素 的 完全 括号 化 的 表 
达 式 之 间 有 着 一 一 对 应 . 
一 个 西 多 边 形 <v,，vY, ，…，vY，， > 的 一 种 三 角 章 分 也 可 用 一 棵 分 析 树 来 表示 。 

图 16.5(b) 示 出 了 与 图 16.4(a) 中 多 边 形 的 三 角 剖 分 对 应 的 分 析 糙 。 树 的 内 节点 为 三 角 痢 分 的 
弦 ， 再 加 上 边 Yvv, ， 它 是 树 的 根 。 叶 节点 是 多 边 形 的 另 一 些 边 。 根 Yovs 是 三 角形 Avovivs 
“的 一 条 边 。 这 个 三 角形 决定 了 根 的 子 节点 : .一 个 是 蕊 Yuv, ， 另 一 个 是 弦 vjy。 。 注 意 这 个 三 
角 灌 把 愿 多边 形 分 成 了 三 个 部 分 : 三 角形 Avuv,v, 自身 ， 多 边 形 < vv …， vv > ， 
和 和 多边形 < v, ，v,，…，v > 。 两 个 子 多 边 形 完全 由 原 多 按 形 的 边 构成 ， 除 了 它们 的 根 之 


外 (它们 是 纺 WY7 和 人 ) 。 多 边 形 <vu，v,，…，v; > 又 递归 地 包含 分 析 树 根 的 左 子 
树 ， 多 边 形 < ，v ，…，v, > 包含 右 子 树 。 





图 16.5 分 析 树 


一 般 来 说 。， 对 有 nm 条 边 的 多 按 形 的 一 个 三 角 训 分 与 具有 ni 个 上 时 节点 的 分 析 树 对 应 ， 
按 一 个 相反 的 过 程 ， 我 们 可 巾 一 棵 给 定 的 分 析 树 产生 出 一 个 演 角 剖 分 。 在 分 析 树 和 三 角 裔 分 
之 间 也 存在 着 一 一 对 庶 。 

因为 a 个 矩阵 的 滋 积 的 一 个 完全 揪 号 化 与 具有 mn 个 时 节点 的 分 析 树 对 应 ， 故 它 又 与 包 
舍 (n+i) 个 顶点 的 多 边 形 的 一 个 三 角 放 分 相对 应 。 图 16.5(aj 和 (b) 说 明了 这 种 对 应 。 乘 积 AIAs， 


-ae 


…Au 中 的 每 个 Ai 与 有 (n+1) 个 顶点 的 多 边 形 的 一 条 边 六 7 相对 应 。 弦 YY G<j 与 计算 抑 


了 一 1 了 
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阵 称 积 过 程 中 的 某 个 矩阵 Ai ; 相对 应 ， 

实际 上 ， 和 矩阵 链 滋 积 问题 是 最 优 三 角 训 分 疝 题 的 一 个 特殊 情况 ， 即 矩阵 链 嫌 积 的 每 个 实 
例 可 被 改造 成 一 个 最 优 三 角 剂 分 问题 ， 给 定 一 个 矩阵 链 匀 积 AAA 和， 定义 -个 有 (n+H) 个 
顶点 的 凸 多 边 形 P= <vowrw > 。 对 i= 12…20 如 果 和 矩阵 A 的 维 数 是 pi_ ,xpi， 则 定义 
三 角 训 分 的 权 函 教 为 

WAAvivvD 一 岂 Dipr 
在 此 权 项 数 下 的 一 个 最 优 三 角 齐 分 就 给 出 了 AiA:…A。 的 一 个 最 优 括号 化 的 分 析 树 。 

反 过 来 说 ， 最 优 三 角 放 分 问题 不 是 矩阵 链 乘 积 操 题 的 一 个 特例 .但 是 16.1 节 中 的 MA- 
TRIEX-CHAIN-ORDER 的 代码 只 要 做 少许 变动 就 可 用 来 解 一 个 (n+hH 顶 点 多 边 形 的 最 优 三 
角 谢 分 问题 了 。 只 体 做 法 是 将 矩阵 维 数 序列 <popt…ps> 蔡 换 成 项 点 序列 <vyovb .Yan> ， 
把 对 也 的 引用 换 成 对 v 的 引用 ， 并 把 第 9 行 改写 为 

乡 do qimn[ikhm[k+liHw(Av ww 

在 执行 该 算法 后 ， 元 泰 mLaj] 就 包含 了 一 个 最 优 三 角 剂 分 的 权 。 下 面 我 们 将 会 知道 为 什 

么 会 有 这 个 结果 。 


最 优 三 角 毅 分 的 子 结构 


考虑 一 个 (n+1 顶 点 客 边 形 P= <vovi 和 ww 的 一 种 最 优 三 角 剂 分 下， 该 洛 边 形 包 含 三 
和 朋 形 和 八 vovval 和 ksn1， 了 的 权 为 Avoviv, 与 对 两 个 子 和 多边 形 <vwo，v， …，> 和 < 天 W 
wm，…，vwa> 的 三 角 剖 分 中 的 三 角形 的 权 之 和 。 所 以 ， 由 T 所 决定 的 子 多 边 形 的 三 角 剖 分 
必 是 最 优 的 ， 因 为 对 这 两 个 子 锡 边 形 中 任 一 个 的 具有 更 小 的 权 的 三 角 章 分 就 会 导致 与 的 
权 的 最 小 性 的 矛盾 。 


一 个 递归 解 


就 像 我 们 将 m[ij] 定 义 为 计算 矩阵 链子 滋 积 AIAs…Ai 的 最 小 代价 一 样 ， 现 定义 世 jl(1 
和 iji<j 和 切 为 多 边 形 <v_iw…w> 的 一 个 最 优 三 角 市 分 的 权 。 为 方便 起 见 ， 我 们 认为 一 个 
租 化 多 边 形 <w twi> 的 权 为 0。 多 边 形 P 的 一 个 最 优 三 角 剖 分 的 权 由 刀 四 给 出 。 

下 一 步 是 递归 地 定义 谍 ，j。 基 础 是 禽 二 个 顶点 的 退化 多 边 形 情况 : 引 ，j= 0，i= 1， 
2，…，n。 当 放 i 基 1 时 ， 有 至 少 包含 三 个 顶点 的 多 边 形 <v_，w，…，T> 。 我 们 希望 对 所 
有 颜 点 如 人 帮 王 ii 计 1，…， 放 全 ， Avawvww 将 权 与 多 边 形 <vVbyw…wo 和 <vk， WU 
> 的 最 优 三 角 齐 分 的 权 之 和 最 小 。 故 递归 式 为 


0 若 i 一 j 
_ 16.7 
芭 | min {t+t 攻 +1ilt+wAv vv 针 着 i<] 6 


1 一 [ 上 | 
1 号 长 区] 一 


请 将 这 个 递归 式 与 我 们 给 出 的 计算 AIA;,…Ai 所 需 的 最 少 标量 乘法 次 数 mi 中] 的 递归 式 
(16.2) 进 行 比较 。 除了 权 函 数 这 一 点 外 ， 这 两 个 递归 式 是 相同 的 。 所 以 ， 只 要 对 上 面 担 到 的 
代码 作 少 许 的 变动 ， 过 程 MATRIX-CHAIN-ORDER 就 可 用 来 计算 一 个 最 优 三 角 剖 分 的 
权 ， 像 MATRIX-CHAIN-ORDER -一样 ， 最 优 三 角 剖 分 过 程 的 时 空 代价 分 别 为 Btn ) 和 
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加 fn 人 
思考 题 、 
16-1 Bitonic 欧 风 里 德 货 郎 担 问 题 


欧 几 里 德 货 邹 担 问题 是 对 平面 上 给 定 的 n 个 点 确定 一 条 连结 各 点 的 、 闭 合 的 游历 路 线 
的 问题 。 图 16.6 在 一 个 单位 糙 栅 上 示 出 了 平面 上 的 七 个 点 ，(g) 给 出 了 七 个 点 问题 的 解 。 
(a) 即 最 短 的 闭 游 程 ， 其 长 度 为 24.888…。 这 个 游程 不 是 bitonie 的 。 这 个 问题 的 一 般 形式 
是 NB 完全 的 ， 故 其 解 需要 多 于 多项式 的 时 间 { 兄 第 三 十 六 章 )}。 、 

J.L.Bentley 建议 通过 只 考 虞 bitonic 旅行 路 线 来 简化 问题 。 这 种 旅行 路 线 即 从 最 左 点 开 
始 ， 严 格 地 上 由 左 鞋 右 直 到 最 在 点 ， 然 后 严格 地 由 右 向 左 直 奋 出 发 点 。 阁 16.6(b) 示 出 了 同样 
七 个 点 的 量 短 bitonic 游历 ， 其 长 度 25.58。 在 这 个 例子 中 ， 一 个 多 项 式 时 间 算 法 是 可 能 的 。 





加 16.6 在 一 个 单位 格 顶 土 示 出 的 等 面 上 的 七 个 点 


请 捍 述 一 个 确定 最 优 bitonic 游历 的 Dn ) 时 间 算 法 。 可 以 假设 任何 两 个 节点 的 工 坐 标 
都 不 相同。 


16-2 优美 打印 


考虑 在 一 台 打 印 机 上 优美 地 打印 一 段 文章 的 问题 。 输 入 的 正文 是 长 度 为 1112,…,n( 即 字 
符 个 数 ) 的 na 个 单词 构成 的 学 玛 。 叶 人 而 望 将 这 要义 章 住 拖 行 上 (每 行 的 最 大 长 庆 为 mm) 打 印 
出 来 ， 且 "优美 度 " 的 标准 如 下 。 如 果 某 一 行 包含 从 i 到 j 的 单词 ， 且 每 两 个 单词 间 留 一 空 ， 


则 在 行 末 多 余 的 空格 为 m-it 记 工 ,1 。 我 们 希望 所 有 行 (除了 最 后 一 行 ) 中 行 末 多 余 空格 的 
立方 最 小 。 请 给 出 … 个 动态 程序 设计 算法 来 优美 地 打印 出 一 段 有 个 单词 的 文章 。 另 分 析 所 给 
出 的 算法 的 硅 空 要 求 。 

16-3 编辑 臣 高 

当 一 个 智能 终端 将 一 行 正 文 更 新 ， 并 用 新 的 “和 目标 * 串 红 1.m] 来 闪 换 现存 的 “ 源 "下 


x[1..m] 时 ， 可 有 交 种 方式 来 做 这 种 变换 。 源 串 中 的 单个 字符 可 被 删除 ， 被 苦 换 ， 或 被 复制 到 
旧 标 利 中 去 ;字符 也 可 被 搬入 人; 冰 昌 中 两 个 相 部 字符 可 进行 交换 并 复制 到 月 标 串 中 去 ; 在 完 
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成 其 他 所 有 控 作 之 后 ， 簿 中 中 余下 的 全 部 后 绢 就 可 用 * 删 至 行 林 "的 操作 删除 ， ， 
弄 在 来 海 一 个 例子 ， 将 源 串 algorithm 转换 成 癸 标 串 aitruistic 的 一 -种 方法 是 采 韦 趟 而 的 
操作 序列 : 







copy 生 纪 jgorithlr 


Copy | al gorjtmm 





Te 的 ace 芝 yt at 

昌 elete 口 alt 四 

《OO 昌 ltr 加 

msSedtt 二 生 ]tru 四 

tnsert ; aitrai Lam 

insert $ altruis 让 

twiddle iL into 所 3 寻 TUisti mm 

Insert 已 aitruisftic 1 和 革 国 
mwistic 


要 达到 这 个 结果 还 可 有 其 他 的 一 些 操 作 上 序列。 操作 delete，Treplace，cophy， insett， 
twiddle 入 雇 中 的 每 一 全 都 有 一 个 相 联 系 的 代价 。( 可 以 假设 蔡 换 一 个 字符 的 代价 小 于 插 人 
和 删除 合 起 来 的 代价 ; 否则， 就 无 需 苦 换 操作 了 )。 一 个 给 定 的 操作 序列 的 代价 为 序列 中 务 
操作 代价 之 和 。 对 上 二 面 的 操作 序列 ， 将 algorithm 变换 成 alttraistic 的 的 代价 为 

(3 -costtcopyjjHeost(repilacej-Heost(deieteyH3 costfinsertb) 
TcCosttwiddieyHeost(kil) 

给 定 两 个 序列 1..m]J，Y[1..9 和 一 如 作 代 价 集 合 ，x 到 y 的 编辑 上 离 为 将 x 转 化 汐 y 的 
最 “便宜 “的 转换 序列 的 代价 。 请 给 出 一 个 动态 程序 设计 算法 来 找 出 1..m] 至 吕 1..61 的 编辑 蝶 
离 ， 并 印 出 一 个 最 优 转 换 序 列 。 另 分 析 你 的 算法 的 是 空 代价 。 


16-4 Viterhi 算法 


我 们 可 用 一 有 回 图 台 =(VE) 上 的 动态 程序 设计 米 伐 语音 识别 。 每 条 边 (u,v)C 三 上 祭 以 
选 二 有 限 的 声音 集 y 中 的 一 种 声音 5tuw， 这 种 贺 基 一 个 人 说 一 种 有 限 语 言 的 形式 借 殊 ， 图 
中 从 某 一 项 点 wy 升 始 的 一 条 路 多 就 对 应 于 该 模 陋 了 柯 能 产生 的 一 个 声音 序列 。 菜 一 路 各 
的 标记 定义 为 该 帆 径 上 所 有 过 的 标记 的 毗连 。 

a. 请 描述 一 个 有效 的 竺 法， 使 之 对 给 定 的 过 标记 图 GI 技 中 有 一 个 特别 的 节点 voj 和 > 中 
宇 符 序列 s= < 人 08， 返回 吕 的 一 条 开始 于 的， 标记 为 s 的 路 宙 { 如 果 这 样 的 路 径 
存在 )。 和 否则， 该 和 法 返 问 NO-SUCH-PATH， 分 析 算 法 的 运行 时 间 。( 提 示 : 可 参照 第 二 

证 三 章 中 的 有 汽 枝 念 )。 

现在 ， 侦 迟 符 一 -过 flvi 王 还 有 -一 相 联 系 的 非 负 猎 率 pt， 它 囊 和 示 内 顶点 下 开始 衣 历 
边 人 vv) 并 产生 相 度 的 元 音 的 可 能 性 。 站 性 一 顶点 出 发 的 近 的 园 率 之 和 为 1， 一 条 路 径 的 福 率 
定 交 为 其 上 所 有 过 的 概率 之 积 ， 我 们 可 把 开始 :Fw 的 一 累 路 答 的 概 迹 视 为 从 而 开始 的 一 次 ， 
“随机 六 历 " 将 沿 着 指定 的 路 径 进 行 的 概 认 。 

b. 将 在 人 a) 中 给 出 的 家 法 的 训 以 扩 亮 ， 合 得 半 返 加 一 仇 了 略称 时 ， 它 必 是 开始 于 w 的 、 具 
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有 标记 s 的 一 条 最 可 能 的 路 径 。 分 析 算法 的 运行 时 间 。 
练习 十 六 


16.1i-1 对 各 矩阵 的 维 教 序列 为 5.30,.3,12.5,50.5> 的 矩阵 链 ， 接 出 其 一 个 最 优 解 . 

16.1-2 请 纵 出 一 个 有 效 的 算法 PRINT-OPTIMAL~PARENS、 使 之 在 给 定 册 
MATRIX-CHAIN-ORDER 计算 出 的 表 s 后 ， 印 出 一 个 纸 阵 链 的 最 优 括号 化 。 另 请 分 析 这 个 算法 。 

16.41-3 设 RE 表示 在 计算 其 他 表 项 时 mi 被 MATRIX-CHAITN-CORDER 引用 的 次 数 . 证 明 : 对 
整个 表 总 的 引用 次 数 为 :， 


人 人 RD 于 3 


im 下 


(提示 : 可 利用 等 式 2， 让 一 nta+ DCn+ 1D7 
16.1-4 证 明 : 对 一 售 a 个 元 素 的 表 沁 式 的 全 括号 化 中 情 有 本 1] 对 括号 . 





16.2-1 比 磅 一 下 咀 归 式 (16.4 和 与 分 析 快 迷 排 序 寺 出 现 的 递归 式 {18.4)。 请 解 轰 这 商 个 递归 式 的 解 为 何 
会 截然 不 同 ? 

16.2-2 在 确定 矩阵 链 好 法 中 最 优 乘 法 次 数 时 ， 下 面 娜 种 方 靶 更 为 肥效: 枚 举 对 薪 积 所 有 可 能 的 括号 
尼 ， 并 一 一 计算 ; 调用 ECURSIVE-MATRIX-CHAIN。 对 答案 如 以 说 明 。 

16.2-3 画 出 1.3.1 节 中 过 程 MERGE-SORT 作用 于 包 人 洁 16 个 元 素 的 数组 上 的 递归 树 ， 请 解释 对 一 
个 好 的 分 治 算法 奶 MERGE-SORT， 记 忆 化 方法 为 何 汲 有 和 人 么 效果 ? 


16.3-~1 确定 <1，0，0，1、 小 1，0，1> 和 <0，1，0，1，1，0，1，1，0> 的 一 个 LCS。 

16.3~2 ”说明 如 何在 不 用 表 b 的 情况 下 ， 通过 已 计算 出 的 表 c 和 输 人 序列 买 = <8，22，…， 和 > 与 
Y= <y，7，…， 加 > 在 DOlmn+to 时 间 内 重 构 一 个 LCS。 

16.3-3“ 博 给 出 一 个 LCS-ELENGTH 的 这 行 时 间 为 Oftmt+mo 的 记忆 化 版 本 . 

16.3-4 说 明 如 何 仅 用 表 s 中 的 2mintm，m) 项 以 及 OU 的 额外 空间 来 计算 一 个 LCS 的 长 度 、 热 后 ， 
说 明 姑 何 遇 mintmn，m 项 青 加 上 oOtt) 的 额外 空间 来 做 到 这 一 点 。 

16.3-5 请 给 出 一 个 Do3 时 间 的 算法 ， 使 之 能 找 出 -- 个 他 含 a 个 数 的 序列 中 最 长 的 单调 递增 子 译 列 。 

16.3-6 * ”请 结 出 一 个 能 找 出 包 仓 mn 个 数 的 厚 列 中 量 长 单调 子 序列 的 Dang 妇 时 间 算 法 . 


16.4-1 证 明 ; 有 n 个 顶点 的 凸 多 边 形 的 每 种 三 角 剂 分 都 有 n-3 条 东 ， 并 将 多 过 形 划分 为 mn 2 个 三 祭 
形 ， 
16.4-2 在 某 三 角形 的 权 即 其 面积 的 特殊 情 训 下， 可 能 存在 一 个 更 快 的 解 最 优 三 角 齐 分 问题 的 仁 法 
吗 。 ， 
16.4 -3 假设 权 数 w 是 基于 -- 种 三 角 齐 分 的 弦 而 定义 的 。 出 在 w 下 某 一 三 角 放 分 的 权 就 是 该 三 角 齐 
分 中 各 纺 的 权 之 和 。 证 明 :; 愉 有 带 权 弦 的 最 优 三 角 亨 分 疝 题 是 具有 带 权 兰 角 形 的 最 优 三 角 剂 分 坷 题 的 特 
例 ， 

46.4.-4 请 找 出 具有 单位 长 许 近 的 正 作 边 形 的 一 个 最 优 三 贡 前 分。 可 使 用 权 函 数 

Www 一 ViewsFtHwvil 

其 中 lwvl 是 抽 到 w 的 欧 氏 距离 (一 个 正 多 边 形 悬 一 个 各 边 相等 、 各 内 攻 相等 的 多 边 撒 )- 


第 十 七 章 ”贪心 算法 


适用 于 最 优化 问题 的 算法 往往 包含 -系列 步 又 ， 每 一 步 都 有 -组 移 择 。 对 许多 最 优化 间 
题 来 说 ， 采 用 动态 程序 设计 方法 来 决定 最 佳 选择 就 有 点 * 杀 鸡 用 牛刀 "了 ， 只 要 采用 另 一 些 更 
简 音 有 效 的 算法 就 行 了 。 仿 心算 法 是 这 样 一 种 算法 ， 其 特点 是 所 做 的 选择 都 是 目前 最 佳 的 。 
亦 郑 ， 它 期 望 通过 所 做 的 局 部 最 优选 择 产 生出 一 个 全 局 最 优 解 。 这 一 章 讨论 可 由 贪心 算法 解 
决 的 最 优化 问题 . 

例 心 算法 对 大 多 数 优化 问题 来 说 能 产生 最 优 解 ， 但 也 并 不 总 是 这 样 。17.1 节 中 我 们 要 
上 转 看 一 个 简单 而 不 可 轻视 的 问题 ， 即 活动 选择 问题 。 利 用 贪心 算法 可 以 很 有 效 地 计算 出 它 的 
解 。 接 着 ，17.2 节 中 我 们 对 贪心 方法 的 一 些 基本 内 容 作 个 回顾 。17.3 节 要 给 出 贪心 技术 的 
一 个 重要 应 用 : 数据 压缩 (Huffman) 码 的 设计 。 在 17.4 节 里 ， 我 们 要 研究 称 为 “ 失 阵 胚 "的 组 
合 结构 所 基于 的 基本 理论 。 对 这 种 组 合 结构 ， 贪 心算 法 总 能 产生 出 最 优 解 。 最 后 ，17.5 节 
通过 带 期 限 和 罚款 的 单位 时 间作 业 调度 问题 来 说 明和 矩阵 有 凸 的 应 用 。 

贪心 方法 是 一 种 很 有 效 的 方法 ， 适 用 于 一 大 类 问题 。 后面 的 章节 中 将 给 出 许多 可 被 视 为 
信心 法 的 应 用 的 算法 ， 如 最 小 生成 树 算法 (第 二 十 四 章 )，Dijkstra 的 单 源 最 短路 径 (第 二 十 五 
章 )， 以 及 Chvatal 的 贪心 集合 复 盖 启 发 式 (第 三 十 七 章 )， 等 等 。 最 小 生成 树 是 贪心 法 的 一 个 
经 典 例子 。 虽 然 这 一 章 可 以 儿 有 立 于 第 二 十 四 章 来 阅读 ， 但 若 把 它们 结合 起 来 看 是 有 益处 的 . 


17.1 活动 选择 问题 


楼 举 的 第 一 个 例子 是 在 几 个 竟 争 的 活动 之 间 调 度 一 个 资源 的 问题 。 迹 者 们 将 看 到 ， 对 这 
个 问题 贪心 算法 提供 了 一 个 寻找 最 大 的 兼容 活动 集合 的 漂亮 而 简单 的 方法 。 
候 设 有 一 个 由 需 朗 使 用 某 一 次 源 ( 如 教室 等 } 的 互 不 活动 组 成 前 集合 S= {1.2,…m}。 该 资 
源 一 次 只 能 被 一 个 活动 占用 。 每 个 活动 1 有 个 开始 时 间 s 和 结束 时 间 全 且 si 么 ff。 一 旦 被 选 
. 择 ， 活 动 i 就 占据 半 开 时 间 区 间 [sb 人 条 。 活 动 1 和 j 是 兼容 的 ， 如 果 区 则 [si,6 与 , 全 瑟 不 重 登 
《 亦 即 ， 活 动 ; 和 j 是 兼容 的 ， 如 果 sf 或 sz 名 。 活 动 选择 问题 就 是 要 选择 ~- 个 由 互相 羔 容 
的 问题 组 成 的 最 大 集合 。 
以 下 伪 代 碍 对 应 于 解 顽 这 个 问题 的 贪心 算 甘 。 候 设 输 人 的 宅 动 接续 且 时 间 递 增 序 排列 : 
有 委 包 委 … 扫 上 《17.1) 
如 果 不 是 这 样 ， 我 们 可 在 OUg 四 时 间 内 将 它们 排 成 此 序 ， 伪 代码 中 假设 了 输 人 5 和 了 ?是 
用 数组 来 表示 的 。 
GREEDY-ACTIIVITY-SELECTOR(s 
1 ne-iength[ 引 
2 上 < } 
3 和-1 


to 
do 这 si 六 全 


嫩 ff ie -2 


S 
避 
了 


then 各 ~ 各 有 


i- 


避 Tetmttt 各 


加 本 时 = 四 到 呆 王 


ff 后 们 宇 
om rm 凡 属 
局 mn 避 人 


13 


二 


14 





在 无 边 络 出 前 小- 个 活动 了 宫 表 BEDY 一 ACTIVITY-SELECTOR 的 操作 过 程 


图 17.1 
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该 算法 的 操作 过 程 如 图 17.1 所 示 : 图 前 每 一 行 与 的 代码 的 第 4-7 行 中 for 循环 的 一 次 执 
行 对 应 。 被 选择 到 集合 A 中 的 活动 都 加 了 阴影 ， 而 当前 被 考虑 的 活动 i 为 白色 。 如 果 活 动 计 
的 开始 时 间 皇 前 于 最 近 被 选择 的 活动 j 的 结束 时 间 〔〈 它 们 之 闻 的 箭头 指向 左边 )， 则 帘 放 
弃 。 否 则 《箭头 直 指 向 土 或 右边 )， 该 活动 被 接受 并 被 放 人 千 合 A 中 。 最 后 集合 A 中 包含 
了 被 选择 的 活动 。 变 量 j 指示 了 撤 近 向 A 中 加 人 药 活 动 。 因 为 我 们 是 按 结束 时 间 的 非 降序 
来 考虑 各 活动 的 ， 故 硬 总 是 A 中 所 有 活动 中 的 最 大 完成 时 间 ， 亦 即 
芋 一 Qiax 【PK 及 | (17. 分 
代码 中 第 2-3 行 选 择 第 一 个 活动 ， 将 A 初始 化 为 仅 包 含 这 个 活动 ， 并 使 j 指向 这 个 活 
动 。 第 4-7 行 依次 考虑 华 个 活动 i， 如 果 它 与 已 选中 的 所 有 活动 兼容 就 将 它 加 到 A 中 。 为 检 
查 1! 是否 与 A 中 当前 所 有 的 猪 动 兼 窜 ， 可 根据 (017.2) 式 来 检查 (第 5 行 ) 其 开始 时 间 s 是 否 不 
昱 十 最近 基 到 A 中 的 笑 动 的 结束 寻 间 ff。 如 果 活 动 j 是 兼容 的 ， 则 在 第 6 了 7 行 里 就 将 它 加 到 
A 中 ， 并 修改 GREEDY--ACTIVITY-SELECTOR 过 程 非常 有 将。 若 假 设 所 有 m 个 活 
动 者 已 按 它 们 的 完成 时 间 排 好 序 的 话 ， 它 可 在 @(n) 时 间 内 究 成 对 它们 的 调 产 。 
由 GREEDY-ACTIVITY-SELECTOR 所 选择 的 下 一 个 活动 总 是 可 被 舍 法 调 床 的 活动 
中 具有 最 早 结束 寻 间 的 那个 。 所 以 ， 被 选择 的 活动 是 一 个 “贪心 的 "选择 ; 或 从 直觉 上 说 ， 它 
为 余下 的 活动 得 到 调度 留 下 了 尽 可 能 多 的 机 会 。 也 就 是 说 ， 贫 心 的 选 背 异 能 够 最 大 化 余下 的 
未 调 麻 时 间 最 大 的 那个 选择 。 


证 阴 贪 心算 法 的 正确 性 


贪心 算法 并 不 总 能 产生 出 最 优 解 。 然 而 ， GREEDY-ACTIVITY-SELECTOR 却 总 能 
找 岩 活动 选 择 阿 题 的 某 个 实例 的 最 优 解 。 

定理 17.1 GREEDY-ACTIVITY~-SELECTOR 算法 能 产生 出 活动 选择 问题 的 最 大 规 
模 的 解 。 

和 证明: 设 S= ti.2.… 人 为 要 调度 的 活动 的 集合 。 因 为 我 们 假设 了 所 有 活动 是 按 结 束 时 
间 排 序 的 ， 效 活动 1 共有 最 早 结 束 时 间 。 我 们 希望 证 明 存 在 一 个 由 俩 心 选择 ( 即 活动 0) 开始 
的 最 优 和解 。 

假设 ASS 是 给 定 的 活动 选择 届 题 的 实例 的 一 个 最 优 解 ， 并 将 A 中 的 活动 按 结束 时 间 
排 序 。 进 一 步 假 设 A 中 的 第 一 个 活动 是 活动 K。 如 果 上 = 1，、 则 调度 A 是 由 一 个 贪心 选择 开 
始 的 。 如 果 ke 六 1， 我 们 希望 证 明 另 有 S 前 一 个 最 优 解 B， 它 开始 于 俩 心 选择 活动 1。 设 
史 一 和 一 必 作 及 1。 二 为 二 和 甩 和 ， 故 也 中 的 活动 是 分 离 的 ; 又 因 卫 与 A 中 的 活动 数 相同， 所 
以 它 也 是 最 优 的 。 这 样 ，B 为 $ 的 包含 贪心 选择 活动 1 的 一 个 最 优 和 解 。 剖 之 ， 我 们 证 明了 总 
存在 一 个 以 贪心 选择 开始 的 最 优 调度 。 

当做 遇 了 对 活动 1 的 食 心 选择 后 ， 诛 问题 就 变 为 找 S$ 中 与 活动 1 兼容 的 那些 活动 的 活 ， 
动 选 择 癌 题 的 一 个 最 优 佣 。 亦 即 ， 如 果 A 为 原 问题 $ 的 一 个 最 优 般 ， 则 A7"= A 一 [就 是 医 
荔 选 拌 问题 8 =1CS: 全 的 一 个 最 优 解 。 为 什么 会 这 样 呢 ? 如 果 我 们 能 找到 一 个 S 的 
包 合 比 A“ 更 多 活动 的 解 B， 则 将 锋 动 1 如 到 B' 中 后 就 得 到 $ 的 一 个 包含 出 和 更 多 活 动 的 解 

B， 这 就 与 A 的 最 优 性 闻 盾 。 所 以 ， 在 每 一 次 贪心 选择 后 ， 留 下 的 是 一 个 与 原 问 题 具 有 相册 
形式 的 景 优 化 河 题 。 通过 对 所 做 选择 次 数 的 归纳 ， 可 证 明 ， 在 每 一 步 进 行 贪心 选择 就 可 得 到 
一 个 最 状 解 。 
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17.2 ”贪心 策略 的 基本 内 容 


贪心 算法 是 通过 做 一 系列 的 选择 来 给 出 某 一 问题 的 最 优 解 的 。 对 算法 中 的 每 一 决策 点 ， 
做 一 个 当时 (看 起 来 像 是 ) 最 佳 的 选择 。 这 种 启发 式 策略 并 不 是 总 能 产生 出 最 优 解 ， 但 正 像 我 ， 
们 在 活动 选择 问题 中 看 到 的 那样 ， 它 常常 能 给 出 最 优 解 。 这 一 节 讨 论 贪心 方法 的 某 些 一 般 性 
质 。 
对 一 个 最 优化 问题 ， 我 们 怎样 才能 知道 用 一 个 贪心 算法 来 解 它 是 否 合适 呢 ? 没有 一 个 通 
用 的 方法 。 但 适宜 于 用 货 心 策略 来 解 的 大 多 数 问 题 都 有 两 个 特点 : 贪心 选择 性 质 和 最 优 子 结 
构 。 


贪心 选择 性 质 


第 一 个 关键 特点 是 贪心 选择 性 质 : 一 个 全 局 最 优 解 可 通过 做 局 部 最 优 (贪心 ) 选 择 来 达 
到 。 这 一 点 是 贪心 算法 不 同 于 动态 程序 设计 方法 之 处 。 后 者 在 每 一 步 也 要 做 选择 ， 但 所 做 的 
选择 可 能 要 依赖 于 子 问 题 的 解 。 在 一 个 贪心 算法 中 ， 我 们 所 居 的 总 是 当前 (看 似 ) 最 佳 的 选 
择 ， 然 后 再 解严 做 了 该 遗 择 之 后 所 出 现 的 子 问题 。 贪 心算 法 所 做 的 当前 选择 可 能 要 依赖 于 已 
经 做 出 的 所 有 选择 ， 但 不 依赖 于 有 待 于 做 出 的 选择 或 子 问 题 的 解 。 因 为 ， 不 像 动态 程序 设计 
方法 那样 自 底 向 上 地 解决 子 问题 ， 贪 心 策略 通常 是 自 顶 向 下 地 做 的 ， 一 个 一 个 地 做 出 贪心 选 
择 ， 不 断 地 将 给 定 的 问题 实例 归 约 为 更 小 的 问题 。 

我 们 必须 证 明 在 每 一 步 所 做 的 货 心 选择 最 终 能 产生 一 个 全 局 最 优 解 ， 而 这 也 正 是 需要 机 
巧 的 所 在 。 一 般 来 说 , 如 定理 17.1 中 的 情况 ， 我 们 在 证 明 中 先 考 察 一 个 全 局 最 优 解 ， 然 后 
再 证 明 可 对 该 解 加 以 修改 ， 使 其 第 一 步 为 一 个 俩 心 选 择 ， 这 个 选择 将 原 问 题 变 为 一 个 相 侯 
的 、 但 又 更 小 的 问题 。 这 样 ， 我 们 就 可 用 归纳 法 来 证 明 其 每 一 步 所 做 的 都 是 贪心 选择 在 证 
明了 做 一 次 贪心 选择 就 可 把 原 问题 归 约 为 相似 但 规模 更 小 的 问题 后 , 实际 上 也 就 把 对 正确 性 
.的 证 明 转 化 为 说 明 一 个 最 优 解 必须 具有 最 优 子 结构 的 问题 。 


最 优 了 于 结构 


一 个 问题 呈现 出 最 优 子 结构 ， 如 果 官 的 一 个 最 优 解 包含 了 其 子 问题 的 最 优 和解。 这 个 性 质 
是 用 来 对 某 问题 中 动态 程序 设计 以 及 贪心 算法 的 可 应 用 性 进行 评价 的 关键 一 点 。 作 为 最 优 子 
结 梅 韵 一 个 例子 ， 回 题 一 下 我 们 在 对 定理 17.1 的 证 明 。 证 明 中 说 明了 如 果 活 动 选 择 问 题 的 
一 个 最 优 解 以 活动 1 开始 ， 则 活动 集合 A'= A-{1} 是 活动 选择 问题 S = {ikS: sz 引 } 的 一 
个 最 优 逢 。 


贪心 法 与 动态 程序 设计 


因为 货 心 法 和 动态 程序 设计 方法 都 利用 了 最 优 子 结构 性 质 ， 故 读者 往往 会 在 贪心 解 足以 
解决 问题 的 场合 下 给 出 一 个 动态 程序 设计 解 ， 或 者 正好 相反 。 为 说 明 这 两 种 技术 之 间 的 细微 
区 别 ， 我 们 来 考察 一 个 经 典 优化 问题 的 两 种 变形 。 
0-1 背包 问题 是 这 样 的 。 有 一 个 贼 在 偷窃 一 家 商店 时 发 现 有 n 件 物品 ; 第 i 件 物品 值 
元 ， 重 ww 磅 ， 此 处 w 和 wi 都 是 整数 。 他 希望 带 走 的 东西 越 值钱 越 好 ， 但 他 的 背包 中 至 多 只 
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能 装 下 W 磅 的 东西 ，W 为 一 整数 。 应 该 带 走 哪 几 样 东 西 呢 9 (这 个 问题 被 称 为 0-1 背包 问 
题 ， 因 为 每 件 物品 或 被 带 走 ， 或 被 留 下 ; 小 丛 不 能 只 带 走 某 个 物品 的 一 部 分 或 带 走 两 次 以 上 
一 个 物品 )。 

”在 部 分 背包 问题 中 ， 场 景 等 与 上 面 问题 一 样 ， 但 是 窗 贼 可 以 带 走 物品 的 一 部 分 ， 而 不 必 
极 出 0-:! 的 二 元 选择 。 可 以 把 0~-1 背包 问题 的 一 一 件 物品 想像 成 像 一 人 个 多 傍 ， 而 部 分 背包 问 
题 中 的 一 件 物品 则 更 像 金粉 。 

两 种 背包 问题 都 共有 最 优 子 结构 性 质 。 对 0-1 问题 ， 考 虑 重量 至 多 为 友 磅 的 最 值钱 的 
一 包 东 西 。 如 果 我 们 从 中 去 掉 物 品 j， 余 下 的 必须 是 窃 颈 从 除 j 以 外 的 nl 件 物品 可 以 带 走 
的 重量 至 多 为 W-wi 的 最 值钱 的 一 包 东 西 。 对 部 分 背包 问题 ， 考 虑 如 果 我 们 从 最 优 货物 中 
去 掉 某 物品 j 的 重量 w， 则 余下 的 货物 必须 是 窃贼 可 以 从 n-i 件 原 有 物品 和 物品 j 的 w 一 w 
磅 中 可 带 走 的 、 重 量 至 多 为 妈 -wW 的 、 最 值钱 的 一 包 东 西 . 

虽然 这 两 个 问题 非常 相似 ， 但 部 分 背包 问题 可 用 贪心 策略 来 解决 ， 而 0--1 背包 问题 却 
不 行 。 为 解决 部 分 背包 问题 ， 我 们 先 对 每 件 物品 计算 其 每 磅 的 价值 wy w。 按 照 一 种 贫 心 策 
赂 ， 窗 贼 开 始 时 对 具有 最 大 每 磅 价值 的 物品 尽量 多 拿 一 些 。 如 果 他 拿 完 了 该 物品 而 仍 可 以 取 
一 些 其 他 物品 时 ， 他 就 再 取 具 有 次 大 的 每 磅 价值 的 物品 ， 一 直 继 续 下 去 ， 直 到 木 能 再 取 了 为 
止 。 这 祥 ， 有 适 过 按 每 磅 价值 来 对 所 有 物品 排序 ， 货 心算 法 就 可 以 OUn 过问 时 间 运 行 。 关 于 
部 分 背包 问题 具有 贪心 选择 性 质 的 证 明 留 作 练习 17.2-1 

为 搞 清 楚 为 什么 这 种 货 心 策略 不 适用 于 fr--1 背包 问题 ， 让 我 们 来 看 -一 个 该 问题 的 实 
例 ， 如 图 17.2(a) 所 示 。 总 共有 3 件 物 蜗 ， 背 包 评 容纳 50 蒋 重 的 东西 。，(a) . 窃 驮 必须 选择 示 
出 的 三 样 东西 的 一 个 子 集 ， 使 其 重量 不 超过 5 磅 。(b) 包括 第 2 和 第 3 样 东 西 的 最 优 子 
集 。 任 意 所 有 包括 第 1 样 东西 的 解 都 是 玫 最 优 的 ， 即 使 其 每 磅 价值 最 大 。(c) 对 部 分 背包 问 
题 ， 只 要 控 最 大 的 每 磅 价值 次 序 来 取 各 样 物品 即 可 产生 一 个 最 优 解 。 物 品 1 重 10 矿 ， 值 0 
元 ; 物品 2 重 20 磅 ， 值 100 元 ; 物品 3 重 30 磅 ， 值 120 元 。 这 样 ， 物 品 1 是 每 磅 6 元， 大 
”于 物品 2 的 每 态 5 元 或 物品 3 的 每 往 4 元 。 按 照 贪 心 策略 的 话 就 要 取 物 品 1。 然 后 ， 从 图 
17.2(b) 中 的 分 析 可 以 看 出 ， 最 优 解 取 的 是 物品 2 和 3， 没 有 取 1。 两 种 包 食物 1 的 可 能 解 都 
是 次 最 优 的 。 
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图 17.2 售 心 策略 不 适合 于 呈 1 背 包 问 题 


对 部 分 背包 含 问题 ， 在 按照 售 心 策略 先 取 物 品 1 以 后 ， 确 实 可 产生 一 个 最 优 解 ， 如 图 
17.2(e 所 和 示 。 在 0-1 青 包 问 题 中 不 应 取 物 品 1 的 原因 在 于 这 样 无 法 将 背包 填 满 ， 空 余 的 空间 
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就 降低 了 他 的 货 牧 的 有 效 每 矿 价 值 . 在 0-1 背包 问题 中 ， 当 我 们 在 考 感 是 否 要 把 一 件 物品 
加 到 背包 中 时 ， 必 须 对 把 该 物品 加 进去 的 子 问题 的 解 与 不 取 该 物品 的 子 问题 的 解 进行 比较 。 
由 这 种 方式 形成 的 问题 导致 了 许多 重 悚 子 问 题 一 一 这 是 动态 程序 设计 方法 的 一 个 特点 。 所 
以 ， 我 们 可 以 用 动态 程序 设计 方法 来 解决 0 -1 背包 问题 ( 见 练习 17.2 一 2。 


17.3 险 夫 最 编 码 


阶 夫 受 编 码 是 一 种 被 广泛 应 用 丽 且 非常 有 效 的 数据 压缩 技术 ， 根 据 待 压 缔 的 文件 的 特 
征 ， 一 般 可 上 压缩 掉 20% 至 90%。 咯 夫 受 贪心 算法 使 用 了 --- 张 字符 频 度 表 ， 根据 它 来 构造 一 
种 将 每 个 字符 表示 成 二 进 绅 的 最 优 方 式 。 

假设 我 们 有 一 个 他 含 100 000(a-0 个 字符 的 数据 文件 要 压缩 存储 。 各 字符 在 该 文件 中 的 
出 现 频 度 见 图 17.3。 大 小 为 100，000 个 字符 的 一 个 数据 文件 仅 包含 字符 a-f， 每 个 的 频 度 
如 图 中 所 示 。 如 果 对 每 个 字符 台 予 一 个 三 位 的 编码 ， 则 该 文件 可 被 编码 为 300 000 位 。 如 果 
利用 图 中 所 示 出 的 可 变 长度 编 码 ， 该 文件 可 被 编码 为 224 000 位 。 


辱 定 长 庶 编 码 
训 变 长 度 编码 






图 17.3 字符 编码 何 是 


可 坟 有 窗 各 方式 来 表示 这 样 的 一 个 文件 。 我 们 赃 考 虑 设计 一 种 二 进 字符 网 但 (或 略称 为 
编 名 ) 的 问题 ， 其 中 每 个 字符 都 由 了 瞧 一 秀 二 进 串 来 表示 。 如 果 我 们 采用 固定 长 度 编码 ， 则 需 
要 三 位 二 进 数 字 来 表示 六 个 字符 : a=000b= 001…f= 101。 这 种 方法 要 用 300.000 位 来 对 
整个 原文 件 编码 。 能 不 能 做 得 更 好 一 些 呢 ? 

可 变 长 床 编 码 要 比 置 定 长 麻 编 码 好 得 多 ， 其 特点 是 对 频 度 融 的 字符 赋 以 短 编 本 ， 而 对 频 
度 低 的 字符 则 屿 以 较 长 一 些 的 编码 。 图 17.3 未 出 这 样 一 种 编码 ， 其 中 一 位 审 0 表示 a， 四 位 
串 1100 表示 七 这 种 编码 方式 怖 要 

(45 - if+13 .3T12 .3++16 349 45 有 .1000=224000 位 

来 表示 整个 文件 ， 即 可 压缩 掉 约 25%。 实 际 上 ， 对 这 个 立 件 来 说 ， 这 已 是 一 种 最 优 字 符 编 
玛 了 ， 这 一 点 我 们 稍 后 将 会 看 到 . 

前 绥 缩 玛 

我 们 这 区 考虑 的 编码 方案 中 ， 没 有 一 个 编码 是 另 一 个 编码 的 前 受 。 这 样 的 编码 也 被 称 为 
前 绥 编 码 ， 可 以 证 明 ( 这 上 几 就 略 去 了 )， 由 字符 编码 技术 扩 获 得 的 最 优 数 据 压缩 总 可 用 茶 种 前 
角 编 玛 求 获 得 . 


前 缀 编码 的 好 处 在 于 它 简化 了 编码 (压缩 ) 和 解码 。 对 任何 一 种 二 进 字符 编码 来 说 编码 总 
是 简单 的 ， 这 上 只 要 将 文件 中 每 个 字符 的 编码 并 署 起 来 即 可 。 例如 ， 利 用 图 17.3 中 的 可 变 长 
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度 编码 ， 我 们 可 把 包含 三 个 字符 的 文件 abc 编码 成 0. 101 : 100=0101100， 此 处 * .“ 表 示 
并 置 。 

在 前 镖 编码 中 解码 也 是 很 方便 的 。 因 为 没有 一 个 码 是 其 他 码 的 前 级 ， 故 被 编码 文件 的 开 
始 处 的 编码 是 确定 的 。 我 们 只 要 识别 出 第 一 个 编码 ， 将 它 翻 译 成 原文 字符 ， 从 编码 文件 中 去 
掉 ， 再 对 余下 的 编码 文件 重复 这 个 过 程 即 可 。 在 我 们 的 例子 中 ， 可 将 串 001011101 唯一 地 分 
析 为 0.0: 101 :1101， 因 而 可 解码 为 aabe。 四 

解码 过 程 需要 有 一 种 关于 前 缀 编码 的 方便 的 表示 ， 使 得 初始 编码 可 以 很 容易 地 被 识别 出 
来 。 有 一 种 表示 方法 就 是 叶子 为 给 定 字 符 的 二 叉 树 。 在 这 种 树 中 ， 我 们 将 一 个 字符 的 编码 解 
释 为 从 根 至 该 字符 的 路 径 ， 其 中 0 表示 “转向 左 子 节点 "，1L 表 示 “转向 右 子 节点 "。 图 17.4 给 
出 了 与 我 们 的 例子 中 两 种 编码 对 应 的 二 叉 树 。 每 个 叶子 被 标 以 一 个 字符 及 其 出 现 的 频 度 。 每 
个 内 节点 被 标 以 其 子 树 中 所 有 叶子 的 权 之 和 。{a) 与 固定 长 度 编码 a=000，…，f= 100 对 
应 的 树 。 (b) 与 最 优 前 名 编 码 a=0，b=|0l，…，f= 1100 对 应 的 树 。 注 意 它们 并 不 是 二 叉 
查找 树 ， 因 为 各 时节 点 无 需 以 排序 次 序 出 现 ， 且 内 节点 也 不 包含 关键 字 。 





人 tb) 
图 17.4 ”与 后 17.3 中 编码 方案 对 应 的 树 


一 个 文件 的 一 种 最 优 编码 总 是 由 一 棵 满 二 叉 树 来 表示 的 ， 树 中 每 个 非 叶 节点 都 有 两 个 子 


节点 ( 见 练 习 17.3- DJ。 在 我 们 的 例子 中 的 固定 长 度 编 码 不 是 最 优 编码 ， 因 为 表示 它 的 树 ( 如 


图 17.4(a) 所 示 ) 不 是 满 的 : 有 的 编码 开始 于 10…， 但 没有 一 个 开始 于 11…。 因 为 我 们 现在 
可 以 把 注意 力 集中 到 满 二 叉 树 上 ， 故 可 工 说 如 果 C 是 包含 待 编码 字符 的 字 母 表 ， 则 表示 最 
优 前 绷 编 码 的 树 中 怡 有 |C| 片 叶子 ， 每 一 片 表示 字母 表 中 的 一 个 字母 ， 另 还 有 |CIt 个 内 节 
点 。 

” ”给 定 对 应 一 种 前 名 编 码 的 二 叉 树 T， 很 容易 计算 出 编码 一 个 文件 所 需 的 位 数 。 对 字 坪 表 
C 中 的 每 一 个 字符 c， 设 fr 加 表示 e 在 文件 中 出 现 的 频 订 ，dr(o 表 示 ec 的 叶子 在 树 中 的 诬 
度 。 注 意 dr(c) 也 是 字符 c 的 编码 的 长 度 。 这 样 ， 编 码 一 个 文件 所 需 的 位 数 就 是 


BIT) 王 2 fcjd_(c) [17.3) 


心 已 民 ， 


我 们 把 它 定 义 为 树 工 的 代价 。 
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构造 哈 夫 受 编 码 


哈 夫 曼 设 计 了 -个 可 用 来 构造 一 种 称 为 险 夫 曼 编 码 的 最 优 前 绷 码 的 仿 心 算法 。 该 算法 以 
自 底 向 上 的 方式 来 构造 对 应 于 最 优 编码 的 树 工 。 它 从 |C| 个 叶 节 点 开始 ， 并 执行 |CI-1 次 “ 合 
并 "操作 来 构造 最 终 的 树 。 

在 下 面 的 伪 代 码 中 ， 我 们 假设 C 是 一 个 包含 nm 个 字符 的 集合 ， 且 每 个 字符 eCC 都 是 一 
个 具有 频 庶 f] 的 对 象 。 代 码 中 还 用 到 一 个 以 了 为 关键 字 的 优先 级 队列 来 识别 出 要 合并 的 两 
个 频 度 最 低 的 对 象 。 合 并 的 结果 是 一 个 新 对 象 ， 其 频 度 为 被 合并 的 两 个 对 象 的 频 度 之 和 。 

HUPFEMANIC) 
1 nlCl 

2 总 < 

3 fori1 ton 一 | 


4 do z< ALLOCATE--NODEI) 
5 xleftlz]<- -EXTRACT-MINIO) 
和 y< right[z]<-EXTRACT-MINIO) 
7 其 zl< 一 全 xlHf[y] 
8 INSERTI(Q:z) 
号 retutn 厂 XTRACT-MINIG) 
全 [区 避 区 加 攻 9 区 二 臣 末 人 区 梧 区 二 人 区 1 疡 竺 
如 1 
[5 [| e 浊 | 
0 3 d 相 人 0 区 友 
OA AN1 0 AN 0 1 站 1 
到 | [ 辐 医 3 Ba 可 全 世 梧 (0 E6 
0 1 
三 5 | La39| 





圆 17.5 ” 哈 夫 曼 算 法 作用 干 网 17.3 中 给 出 的 频 度 上 的 各 个 步 台 


对 我 们 的 例子 ， 哈 夫 紧 算法 的 执行 过 程 如 图 17.5 所 示 。 每 一 个 图 邦 示 出 了 按 频 度 的 递 
增 序 排序 队列 的 内 容 。 在 每 一 步 里 ， 合 并 具有 最 低频 度数 的 两 棵 树 。 叶 子 右 图 中 以 包含 一 个 
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字符 及 其 频 庶 的 方块 示 出 。 内 节点 以 包含 其 各 子女 的 频 度 之 和 的 圆 表示 。. 对 于 连 缚 一 个 内 节 
点 与 其 子女 的 边 来 说 ， 如 果 它 连 向 左 子 女 则 标 以 0， 连 向 右边 由 标 以 1。 一 个 字 生 的 编码 即 ， 
为 连接 根 至 对 应 该 字母 的 叶子 的 所 有 边 上 的 标记 序列 。(a) 包含 n=6 个 节点 的 初始 集合 ， 
每 个 节点 代表 一 个 字母 。 (pb) -- (ce) 各 中 间 阶 段 。 (站 最 终 的 树 。 因 为 字母 表 中 共有 六 个 字 
二 ， 故 初始 队列 的 规模 为 联 =6， 要 构造 编 关 大 共 需 五 步 合 并 。 最 终 的 树 就 表示 了 最 优 前 缀 
编码 ， 其 中 基 一 字母 的 编码 就 是 从 根 至 该 字 嫩 的 路 径 上 边 标记 的 序列 。 

代码 中 第 2 行 以 C 中 的 字符 对 优先 级 队 旭 驴 进行 初始 化 。 第 3 到 8 行 中 的 for 循环 反复 
取出 队列 中 具有 最 低频 度 的 两 个 节点 和 和 y， 并 用 将 它们 合并 后 所 得 的 z 择 人 队列 中 以 蓉 换 
它们 。z 的 频 度 在 第 7 行 中 计算 ， 为 xx 和 y 的 频 手 之 和 。 新 节点 z 以 为 其 左 于 节点 ， 以 了 
为 其 右 子 节点 。( 这 个 次 序 是 任意 的 ; 将 某 一 节点 的 左 、 右 子 节点 交换 所 产生 的 是 一 种 具有 
相交 代价 的 不 同 编码 。) 在 a-1 次 合并 后 ， 在 队列 中 剩 下 的 唯一 节点 一 一 编码 树 的 根 一 一 在 
第 9 行 中 被 返回 。 

在 下 面 对 附 夫 滞 算法 的 运行 时 间 的 分 析 中 ， 我 们 人 恤 设 只 是 用 二 叉 堆 ( 见 第 七 章 ) 来 实现 
的 。 对 包含 了 个 字符 的 集合 C， 第 2 行 中 对 上 的 初始 化 可 用 7.3 市 中 的 BUILD-HEAP 过 
程 在 DO 时 间 内 完成 。 第 3- 行 中 的 for 逢 环 执行 了 Inl-1 次 ， 驴 因 每 一 次 堆 操 作 定 要 Oilg 
mm 时 间 ， 故 整个 循环 需要 On 吉 目 时间。 这样，HUEFFMAN 的 总 的 运行 时 间 为 Onlgm。 .， 


险 夫 法 算 法 的 正确 性 


为 了 证 明 贪心 算法 HUFFMAN 的 正确 性 ， 我 们 就 要 证 明确 定 最 优 前 级 编码 的 问题 具 
有 颌 心 选 择 和 最 优 子 结构 性 质 ， 下 面 一 个 引 理 证 明了 这 个 问题 具有 贪心 选择 性 质 。 

引 理 17.2 ” 设 C 为 一 字母 表 ， 其 中 每 个 字符 ck C 具有 频 度 琵 ]。 设 xx 和 y 为 C 中 具有 
最 低频 度 的 两 个 字符 ， 册 存在 C 的 一 种 最 优 前 技 编 码 ， 其 中 x 和 y 的 编码 长 度 相 同 但 最 后 
一 位 不 同 。 

证 明 : 证 明 的 主要 思想 是 使 树 T 表示 任 一 种 最 优 前 级 编码 ， 然 后 对 它 进 行 禾 改 使 之 表 
示 另 一 种 最 优 前 组 编码 ， 使 得 字符 x 和 y 在 新 树 中 成 为 具有 最 大 深度 的 兄弟 时 节点 。 如 果 我 
“和 们 能 做 到 这 一 点 ， 则 它们 的 编码 就 具有 相同 的 长 度 而 仅仅 最 后 一 位 不 同 。 
设 b 和 e 为 树 T 中 具有 最 大 深度 的 兄 第 时 节点 。 不 失 一 般 性 ， 假 设 flbl 和 ffc,fxs 
下 9}]。 因 为 fd 和 人] 是 两 个 最 低 的 频 度 ， 而 fib] 和 ft] 是 两 个 任意 的 频 度 ， 故 有 fsfblffy] 
乏 人 tl。 如 图 17.6 所 示 ， 在 最 优 树 T 中 总 叶子 b 和 是 最 深 的 节点 中 的 两 个 、 并 且 是 兄弟 。 
叶子 x 和 y 为 哈 夫 曼 算 法 首先 合并 的 两 个 叶子 ; 它们 出 现 于 工 中 任意 的 位 填 上 。 为 获得 树 
T 淹 一 换 藉 瞳 b 和 x。 然 后， 交换 叶子 ec 和 Yy 以 获得 树 T”。 因 为 每 次 交换 并 不 增加 代价 ， 
所 以 所 得 的 树 下 ”也 是 个 最 优 树 。 根 据 (17.3) 式 ， 树 工 和 本 之 间 代 价 上 相差 为 : 


BTD 一 BIDI= fed 一 fed cc) 


丰 上 区 


= fdda_ (Co 二 fbld (bo 一 fold 00 一 fbld vb 
一 克 jd +fipblditb 一 fd pb 一 fd Go 
= (fb 一 frDGd bb 一 a_G9) 


闻 昌 
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图 17.6 对 引 亚 17.2 的 证 明 中 关键 步 又 的 说 明 


这 是 因为 ftb]-fx 和 db)-di(x) 都 是 非 负 的 。 更 具 柱 一 点 ，ffb]-ftx] 是 非 负 的 ， 因 为 x 
怀 具 有 最小 关 度 的 上 下 上 di(b)-drGo0 也 是 非 负 的 ， 因 为 b 为 了 中 具有 最 大 深度 的 叶 节 

。 业 伺 地 ， 因 为 变换 y 与 e 并 不 增加 代价 ， 所 以 BITBCT) 也 是 非 负 的 。 所 以 ，BCT 
< 又 因 工 是 最 优 的 ， 故 BCTDs BC)， 这 就 费 含 着 BIT = BOOT 这样 ， T 就 是 一 樟 
最 优 树 ， 其 中 x 和 y 为 具有 最 大 深度 的 兄弟 叶 节 点 ， 从 而 证 明了 上 述 引 理 。 

_ 由 引 理 17.2 可 知 , 不 失 一 般 性 , 通过 合并 来 构造 一 棵 最 优 畦 的 过 程 可 以 从 合并 两 个 频 度 
最 低 的 字符 的 俩 心 选 择 开 始 。 这 为 什么 是 个 贪心 选择 呢 ? 我 们 可 以 斌 为 一 次 合并 的 代价 就 是 
被 全 并 的 两 个 字符 的 频 放 之 和 。 练 习 17.3-3 证 明了 通过 合并 构造 出 来 的 树 的 总 代价 就 是 各 
次 合并 的 代价 之 和 。 在 每 一 步 所 有 可 能 的 合并 中 , HUFFMAN 选择 一 个 代价 最 小 的 合并 

下 面 的 引 理 证 明了 构造 最 优 前 钴 代码 的 问题 具有 最 已 子 结构 性 质 。 

引 理 17.3 设 工 为 表示 字母 表 C 上 的 一 种 最 优 前 邹 代 码 的 一 棵 满 二 叉 树 。 对 C 中 的 每 
个 字符 ce 定义 有 频 度 ffcl]。 考 虑 工 中 任意 两 个 为 兄弟 时 节点 的 字符 xx 和 y， 并 设 z 为 它们 的 
父 节点 。 嘟 么 ， 若 认为 z 是 一 个 频 度 为 ftzl= fx]+ffy] 的 字符 的 话 ， 树 T=T 人 yj 就 表示 了 
字母 表 C= C-fxy 各 上 的 一 种 最 优 前 绷 编 码 。 

证 明 : 我 们 先 来 证 明 通 过 考虑 (13.3) 式 中 的 各 成 分 代价 来 将 树 工 的 代价 BCD 以 和 树 工 的 
代价 B(T) 表 示 。 对 每 个 cE Cr- 人 XY 1， 我 们 有 dre)= drfe)， 故 flecldr(e=flejdre)。 台 多 
-为 do9=dr= drfz+l， 我 们 有 

和 xjd (xz) + fy]d 一 GdttyDG e+) 
加 = 把]4 (+ (GD 二 于 
根据 此 式 可 得 
BCD= BOT HIxHITy] 

如 果 民 表 示 字 母 表 C* 上 的 一 种 非 最 优 前 缀 代码 ， 网 存在 时 上 为 C“ 中 字符 的 树 T“， 
使 BIT < B(T)。 因 为 z 被 视 为 所 "中 的 一 个 字符 ， 赤 它 必 是 中 的 某 个 时 节点 。 如 果 我 们 
将 X 和 y 播 人 Te? 中 并 使 它们 成 为 z 的 子 节 点 ， 我 们 台 林 得 < 的 一 种 前 级 代码 ， 其 代价 
BT HtfxHty<BCT)， 这 与 工 的 最 优 性 了 矛盾， 所 以 ，T" 对 字母 琢 C 来 说 必 是 最 优 的 。 

定理 17.4 过 程 HUEFFMAN 可 产生 一 种 最 优 前 旨 编 码 。 

证 明 : ”由 引 理 17.2 各 二 型 17.3 直接 可 得 。 


* 17.4 贪心 法 的 理论 基础 


中 


关于 贪心 算 有 着 一 种 很 漂亮 的 理论 ， 这 一 节 里 我 们 要 大 发 介绍 一 下 。 这 种 理论 在 确定 贪 
心 方法 和 何 时 能 产生 最 优 艇 时 非常 有 有 用; 它 要 用 到 一 种 称 为 “ 扰 阵 肚 * 的 组 合 结构 。 昌 然 这 种 理 . 
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论 没 有 杜 盖 贪心 方法 所 适用 的 各 种 情况 (例如 ， 它 没有 涉及 17.1 节 中 的 活动 选择 问题 或 17.3 
节 中 的 哈 夫 曼 编 码 问 题 )， 但 它 确实 村 盖 了 许多 具有 实际 意义 的 情况 。 另 外 ， 这 个 理论 发 展 ， 
很 快 ， 并 正在 覆盖 更 多 的 应用 。 


17.4.4 矩阵 胚 


一 个 矩阵 凸 (matroid) 是 满足 下 列 条 件 的 一 个 序 对 M=(S.D: 

(1D) S 是 一 个 有 穷 非 空 集合 。 

(2)I 是 的 一 个 非 空子 集 族 ， 称 为 S 的 独立 子 集 ， 使 得 如 果 了 BEI 和 A 研 B， 则 AAAEI。 
我 们 说 工 是 得 传 的 ， 如 果 它 满足 这 个 性 质 。 注 意 空 集 四 为 开 的 一 个 成 员 。 

(G) 如 果 ACEI，BETI， 且 IAI<IBI， 则 有 某 个 元 素 xE B-A 使 得 At 革 GEI。 我 们 称 M 
满足 交换 性 质 。 

“和 矩阵 胚 * 这 个 词 是 由 Hassler Whitney 最 早 开 始 用 的 。 他 当时 平 在 研究 这 方面 的 内 容 ， 
其 中 S 的 元 素 是 某 个 给 定 的 矩阵 的 各 个 行 ; 如 果 某 些 行 在 通常 意义 下 是 线性 无 关 的 , 则 它们 
是 独立 的 。 很 容易 证 明 这 种 结构 定义 了 一 个 矩阵 胚 ( 刀 练 习 17.4 一 2)。 

为 理解 矩阵 且 ， 再 来 看 一 看 图 的 矩阵 胚 Mu= (S.，Io)， 它 是 如 下 根据 一 个 给 定 的 无 向 
图 G=(V,B) 来 定义 的 : 

- 集合 So 定义 为 下 ， 即 GG 的 边 集 ; 

. 如 果 A 是 E 的 子 集 ， 则 AEIc 当 且 仅 当 A 是 无 回路 的 。 亦 即 ， 一 组 边 是 独立 的 当 且 公 当 

它们 构成 了 一 个 森林 。 

图 的 矩阵 且 Me 与 最 小 生成 树 问 题 有 很 紧密 的 联系 ， 我 们 将 在 第 二 十 章 对 后 者 作 详细 
介绍 。 

定理 17.5 “如果 G 是 -个 无 向 图 ， 则 Mo= (SuIo) 是 个 矩阵 胚 . 

证 骨 : 显然 ，Se= 了 是 个 有 穷 集合 ; 并 且 ，Ic 是 遗传 的 ， 因 为 森林 的 一 个 子 集 还 是 森 
林 。 换 句 话说 ， 从 非 循环 的 一 组 边 中 去 掉 一 些 边 并 不 会 产生 出 回路 来 。 

现在 ， 要 证 明 Me 满足 交换 性 质 。 假 设 A 和 B 是 台 的 森林 ， 旦 |Bl>|AI。 亦 即 ，A 和 
B 都 由 一 组 无 回路 的 边 构 成 ， 且 卫 中 包含 比 和 中 更 多 的 边 。 

据 和 定理 $.2 可 知 ， 具 有 k 条 边 的 森林 怡 包含 |YI-K 棵 树 。( 可 以 以 另 一 种 方式 来 证 明 这 个 
定理 ， 邑 从 |V| 棵 树 开始 ， 且 没有 边 。 那 么 ， 每 向 森林 中 增加 一 条 边 就 使 禁 的 数目 减少 一 。) 
这 样 ， 森 林 A 就 包含 fVI-IAi 棵 禁 ， 而 森 穆王 则 包含 fvi--|BI 棵 树 . 

因为 森林 B 中 含有 的 树 比 森林 A 中 少 ， 故 森林 了 中 必 包 含 某 棵 树 其 节点 属于 森林 人 A 的 
琴 棵 不 同 的 树 。 此 外 ， 因 为 工 是 连通 的 ， 它 必然 包 食 边 (au,w， 使 得 节点 U 和 Y 在 森林 人 的 
不 同 树 中 。 正 因为 边 (u. 由 连接 了 森林 A 中 现 棵 不 同 的 树 的 节点 ， 故 将 边 (uv) 吉 到 森林 A 中 
后 不 会 产生 回路 。 所 以 ，Me 满足 交换 性 质 ， 从 而 证 明了 Me 是 一 个 和 矩阵 胚 。 

给 定 一 个 矩阵 且 M= (S.D， 我 们 称 元 素  A 为 AEI 的 一 个 扩张 ， 如 果 能 在 保持 独立 
性 的 同时 将 x 加 到 A 中 去 ; 亦 即 ，x 是 A 的 一 个 扩张 ， 如 果 Al j{fej ETI。 作 为 一 个 例子 ， 
我 们 来 考虑 一 个 图 的 矩阵 胚 Me。 如 果 A 是 一 个 独立 的 边 上 所 ， 则 ee 是 A 的 一 个 扩张 当 且 仅 
当 e 不 在 A 中 ， 且 将 X 加 到 A 中 后 不 产生 回路 . 

如 果 A 是 失 阵 凸 M 的 一 个 独立 子 集 ， 我 们 称 A 是 最 大 的 ， 如 果 它 没有 任何 扩张 。 也 
就 是 说 ， 如 果 A 不 被 M 中 比 它 更 大 的 独立 子 集 所 包 依 ， 则 它 是 最 大 的 。 下 面 一 个 性 质 常常 
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是 很 有 用 的 。 

定理 17.6 ” 某 一 矩阵 胚 中 所 有 最 大 的 独立 子 集 的 大 小 都 是 相同 的 ， 

证 明 假设 A 是 M 的 一 个 最 大 独立 子 集 ， 且 存在 M 的 另 一 个 更 大 的 最 大 独立 子 集 
B。 那 么 由 交换 狂 质 可 知 A 可 以 被 扩张 到 一 个 更 大 的 独立 集合 AL jxj，x& B-A。 这 就 与 A 
基 最 大 的 狠 设 相 矛 盾 。 

为 说 明 这 个 定理 ， 我 们 来 考虑 某 连 通 无 向 图 G 的 一 个 抢 阵 胚 Me。Me 的 每 个 最 大 独立 
子 集 都 应 是 一 桂 自 由 树 ， 且 怡 有 连接 G 中 所 有 顶点 的 |VI-1I 条 边 。 这 样 的 一 棵 树 称 为 G 的 
生成 树 。 

我 们 称 一 个 矩阵 胚 M= (S.D 是 加 权 的 ， 如 果 有 -一 个 权 函 数 w 对 每 一 个 元 素 xE S 都 赋 巴 
一 个 正 的 权 值 wCo9。 对 于 8 的 子 集 有 和 式 

w(A)= 一 wx， 入 三 S 


例如 ， 如 果 我 们 以 w(e) 表 示 一 个 图 的 短 阵 克 中 革 条 过 e 的 长 度 ， 则 w(A) 即 为 边 集 A 中 所 有 
边 的 总 长 度 。 


17.4.2 ”关于 加 权 和 矩阵 及 的 贪心 算法 


适宜 于 由 贷 心 方法 来 获得 最 优 解 的 许多 问题 可 以 归结 为 在 加 权 紫 阵 胚 中 找 出 一 个 县 有 最 
大 权 值 的 独立 子 集 的 问题 。 亦 即 ， 给 定 一 个 加 权 和 矩阵 胚 M = 人 .人 J， 我 们 希望 找 出 一 个 独立 
的 且 具 有 最 大 可 能 权 值 的 子 集 为 该 扎 阵 胚 的 一 个 最 优 子 集 。 因 为 任 一 元 素 xeES 的 权 wx 是 
正 的 ， 帮 一 个 最 优 子 集 总 是 一 个 最 大 独立 子 集 一 一 它 总 是 使 A 尽 可 能 地 大 。 

例如 ， 在 最 小 生成 树 问题 中 ， 我 们 已 知 的 是 一 个 连通 无 向 图 如 = (V,E) 和 一 个 长 度 函 数 
w，Ww(e) 是 边 的 ( 正 的 ) 长 度 。( 这 几 我 们 用 长 度 一 词 来 指示 图 中 原先 边 的 权 值 ， 而 用 “ 权 " 这 
个 术语 来 指示 相 联系 的 邱 阵 路 中 的 权 值 )。 我 们 所 要 做 的 是 要 找 出 一 个 包含 着 连接 所 有 预 点 
的 、 且 具有 最 小 总 长 庆 的 边 的 子 集 。 为 将 这 个 问题 看 作为 在 一 矩阵 胚 中 找 出 一 个 最 优 子 集 的 
问题 ， 考 虑 具有 权 画 数 w' 的 加 权 第 阵 胚 MG， 此 处 we= wu 一 we)， 且 w 大 于 各 按 的 最 大 
长 度 。 在 这 个 加 权 和 抵 阵 胚 中 、 所 有 的 权 值 都 是 正 的 ， 且 一 个 最 优 子 集 就 是 一 棵 在 原 图 中 具有 
最 小 总 长 度 的 生成 树 。 更 具体 地 说 ， 每 个 最 大 狐 立 子 集 A 对 应 于 一 棵 生成 树 ， 又 因为 

wAA)=( 人 (VDwo 一 w(A) 

对 任意 最 大 独立 子 集 A 成 立 ， 故 使 各"(A) 最 大 的 独立 子 集 必 使 w(A) 最 小 。 这 样 ， 尾 意 
一 个 可 以 在 其 一 矩阵 有 玛 中 找 出 一 个 最 优 子 集 药 算法 都 可 用 来 解决 最 小 生成 树 问 题 . 

第 二 十 四 章 给 出 了 解决 最 小 生成 树 问题 的 算法 ， 这 上 儿 我 们 所 给 出 的 是 适用 于 任何 加 权 矩 
阵 钙 的 贪心 算法 。 这 个 算法 的 输入 是 一 个 加 权 符 阵 且 M= (S$，D 和 一 个 正 的 权 函 数 w， 返 回 
的 是 一 个 最 优 子 集 A。 在 我 们 的 伪 代 码 中 ， 用 SIM] 和 I[M] 表 示 M 的 组 成 ， 用 mr 表示 权 范 
数 . 该 算法 是 贪心 的 ， 因 为 它 按 权 值 的 非 增 序 来 依次 考 虐 每 个 元 案 xC SS， 如果 AL Je 是 独 
立 的 话 ， 它 就 立即 把 该 元 素 加 到 A 中 。 

何 玉 EEDYTMLw) 
1 点 < 一 全 


2 根据 权 w 按 非 增长 硕 序 对 S[M] 排 序 
3 for 每 个 xESIVM, 根据 权 wtx) 的 非 增长 项 序 
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do 认 Al HxEIOM] 
then AA<-AL fx} 
rettyrm 入 


算法 按 权 值 的 非 增 序 依 次 考虑 $ 的 各 元 素 。 旭 果 正 在 被 考虑 的 元 素 x 加 到 A 中 后 能 保 
持 A 的 独立 性 ， 则 将 其 加 大 A 中 。 和 否则， 放弃 x。 因 为 根据 息 阵 是 的 定义 空 集 是 独立 的 ， 
又 因为 只 有 在 AUjfx} 是 独立 的 情况 下 才 将 x 加 人 到 A 中 ， 根 据 归 纳 法 ， 子 集 A 曾 是 独立 
的 .。 所以，GREEDY 返回 的 是 一 个 独立 子 集 A。 过 一 会 我 们 还 将 看 到 A 是 一 个 具有 最 大 
可 能 权 值 的 子 集 ， 故 A 是 个 最 优 子 集 。 

GREEDY 的 运行 时 间 是 很 容易 分 析 的 。 设 工 表 示 上 中 。GREEDY 的 排序 阶段 的 时 间 为 
Om 世相 。 人 代码 中 第 4 行 对 8 中 的 每 个 元 素 执 行 一 次 ， 共 mn 次 。 在 第 4 行 的 每 次 执行 中 要 检 
查 Atj 如 是 否 是 独立 的 。 如 果 每 次 检查 的 时 间 为 DIffn))， 则 整个 算法 的 运行 时 间 为 Don 1g 
nyTnfRn 为 。 

下 面 再 来 证 明 GREEDY 返回 的 是 一 个 最 优 子 集 。 

引 理 17.7( 矩 阵 有 是 具有 贪心 选择 性 质 ) 假设 M=(S.D 是 一 个 具有 权 函 数 w 的 加 权 上 抑 阵 
耳 ， 且 $ 被 按 权 值 的 非 增 序 进行 排序 ， 设 x 为 S 的 第 一 个 使 {x} 独 立 的 元 素 { 如 果 这 样 的 x 存 
在 的 话 )。 如 果 节 存在， 则 存在 8$ 的 一 个 包含 x 的 最 优 子 集 。 

证 明 : 如 果 这 样 的 xx 不 存在 ， 则 唯一 的 独立 集合 为 空 集 ， 证 明 结 束 。 否 巾 ， 设 了 B 为 任 
意 非 空 的 最 优 子 集 。 假 设 帮 B; 否则 ， 可 证 A= 了 ， 证 明 结束 。 

B 中 没有 一 个 元 素 的 权 值 大 于 w(go。 为 说 明 这 点 ， 和 注意 到 yE 卫 意味 着 { 纯 是 独立 的 ，. 
因为 BEI 且 工 是 遗传 的 。 我 们 选择 的 xx 就 保证 了 对 任意 立 EB，w(z3w(y)。 

如 下 地 构造 集合 A。 开始 时 A = fj， 根据 所 选择 的 x 4 是 独立 的 。 利 用 交换 性质， 
重复 地 在 B 中 找 新 的 可 以 其 至 A 中 而 同时 保持 A 的 独立 性 的 元 素 ， 直 至 |Ai= Bl。 这 样 ， 
胡 = 了 BO，yYEB， 故 有 

WA) 一 W(B) 一 ww(X) 
之 三 (HB) 

因为 吾 是 最 优 的 ， 入 也 必 为 最 优 的 ; 叉 因 为 x&EA， 定 理 得 证 。 

下 面 我 们 要 证 明 ， 一 个 元 素 如 果 开 始 时 不 被 选中 ， 以 后 世 不 会 被 选中 。 

引 理 17.8 设 M=(, 为 任意 一 个 矩阵 且 。 如 果 $ 由 的 元 素 不 是 中 的 一 个 扩张 ， 那 么 
x 也 不 会 是 S 的 任意 独立 子 集 A 的 一 个 扩张 。 

证 明 : 用 反 证 法 来 证 明 。 假 设 x 是 A( 但 不 是 由) 的 一 个 扩张 ， 这 荐 Ai jfx) 就 是 独立 
的 。 因 为 工 是 遗传 的 ， 大 本 } 必 为 独立 的 。 这 就 与 刁 不 是 由 的 扩张 的 假设 相 了 矛盾 。 

引 理 17.8 是 说 任何 元 素 如 果 不 能 被 立即 用 到 ， 则 以 后 也 决 不 会 被 用 到 。 所 以 ， 
GREEDY 在 开始 时 对 $ 中 的 那些 不 是 下 的 扩张 的 元 素 不 予 选 择 决 不 是 滑 掉 了 它们 ， 因 为 
它们 以 后 也 不 会 被 用 到 。 

引 理 17.% 和 矩阵 及 具有 最 优 子 结构 性 质 ) 设 x 为 8 中 第 一 个 被 GREEDY 选择 了 用 了 手 如 
权 和 矩阵 胜 M= (S 汪 的 元 素 。 找 一 个 包 售 x 的 具有 最 大 权 值 的 独立 子 集 的 问题 可 归 约 为 找 出 
加 权 竺 阵 古 M =( ,I 的 一 个 具有 最 大 权 值 的 独立 子 集 的 问题 ， 此 处 

S 一 { 人 ES fxyiEH 
站 = 二 三 S 一 区 上 BLUE 


BC 
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且 M'“ 的 权 函 数 为 ( 受 限于 S 的 ]M 的 权 函 数 (我 们 称 M 为 M 的 由 x 引 起 的 收缩 )。 

证 明 : 如 果 A 为 任意 包含 x 的 M 的 具有 最 大 权 值 的 独立 子 集 ， 那 么 A'=A-fr} 就 是 
M' 的 一 个 独立 子 集 。 反 之 ， 由 M“ 的 任意 独立 子 集 A' 可 得 M 的 一 个 独立 子 集 入 = 和 人 1 
因为 在 两 种 情况 下 都 有 w(A)= w(A?+Hw(z)， 所 以 由 M 中 包含 x 的 一 个 最 大 权 信 解 可 得 M' 

中 的 一 个 最 大 权 值 解 ， 反 之 亦 然 。 

-定理 17.10( 关 于 和 矩 碑 耳 的 贪心 算法 的 正确 性 ) 如 果 M= (S， D 为 一 具有 权 函 数 w 的 加 权 
抵 阵 且 ， 则 调用 GREEDY(M,w) 就 返回 一 个 最 优 子 集 . 

证 明 : 根据 引 理 17.8， 在 开始 时 被 略 去 的 那些 不 是 由 的 扩张 的 元 素 可 以 不 予 考虑 ， 因 
为 它们 不 会 被 用 到 。 一 旦 选择 了 第 一 个 元 素 x， 由 引 理 17.7 可 知 在 台 REEDY 中 将 x 加 到 
A 中 是 正确 的 ， 因 为 存在 着 一 个 包含 x 的 最 优 子 集 。 最 后 ， 引 理 17.9 隐 含 着 余下 的 问题 就 
是 一 个 在 M 的 由 x 引 起 的 收缩 M' 中 寻找 一 个 最 优 子 集 的 问题 。 在 过 程 GREEDY 将 A 置 
为 {} 后 ， 余 下 的 各 个 步 颈 都 可 被 解释 为 是 在 矩阵 有 旺 M'= (S'. 世 中 进行 的 ， 因 为 B 在 M“ 是 独 
立 的 当 且 仅 当 BL HS 在 M 中 是 独立 的 ，B 为 任意 属于 工 的 集合 。 这 样 ，GREEPY 的 后 续 
操作 就 会 找 出 M' 中 的 一 个 具有 最 大 权 值 的 独立 子 集 ， 而 GREEDY 的 全 部 操作 就 可 找 出 M 
的 一 个 具有 最 大 权 值 的 独立 子 集 。 


17.$ ”一 个 任务 调度 问题 


有 一 个 可 用 和 矩阵 胚 来 解决 的 有 趣 问 题 ， 即 在 单个 处 理 器 上 对 若干 个 单位 时 间 任 务 进 行 最 
优 调 度 ， 其 中 每 个 任务 都 有 一 个 截止 期 限 和 超时 的 罚款 。 这 个 问题 看 起 来 很 复杂 ， 但 用 贪心 
算法 来 解决 的 话 虽 惊 人 地 简单 。 

单位 时 间 任 务 是 个 作业 (如 要 在 计算 机 上 运行 的 一 个 程序 )， 它 愉 需 要 一 个 单位 的 运行 时 
间 。 给 定 一 个 单位 时 间 任 务 的 集合 $S， 对 S 的 一 个 调 育 即 $ 的 一 个 排列 ， 它 规定 了 各 任务 执 
行 的 闫 序 ， 该 调度 中 的 第 一 个 任务 开始 于 时 间 0， 结 束 于 时 间 1; 第 二 个 任务 于 始 于 时 间 
1， 结 束 于 时 间 2， 等 等 。 

单 处 理 器 上 具有 期 限 和 罚款 的 单位 时 间 任 务 调度 问题 的 输 和 人 人 如下: 

-和 忽 售 ma 个 单位 时 闻 任 务 的 集合 S=|2… 和 9 

-0 个 取 整 数值 的 期 限 di,d4…,d, 每 个 d 满 足 1 委 di 和 nm 任务 ji 要 求 在 时 间 4i 前 完成 。 

- n 个 非 负 的 权 ( 或 罚款 )wi wm 蜂 . 如 果 任 务 i 届 在 时 间 d 之 前 结束 则 导致 放款 wi。 

我 们 要 做 的 是 找 出 $ 的 一 个 调度 ， 使 之 最 小 化 总 的 罚款 。 

考虑 一 个 给 定 的 调度 。 我 们 说 一 个 任务 在 该 调度 中 迟 了 ， 如 果 它 在 规定 的 期 限 之 后 完 
成 ， 和 否则 ， 这 个 任务 在 该 调度 中 是 时 的 。 一 个 任意 的 调度 总 可 以 安排 把 早 任 务 优 先 形 式 ， 其 
中 旺 的 任务 总 是 前 于 迟 的 任务 。 为 了 摘 清 楚 这 一 点 ， 请 注意 如 果 某 个 早 的 任务 x 跟 在 某 个 返 
的 任务 y 之 后 ， 我 们 就 可 以 交换 x 和 y 的 位 置 ， 并 不 影响 x 是 时 的 或 了 是 迟 的 状态 。 

类 似 地 ， 任 意 一 个 调度 还 可 被 安排 成 规范 形式 ， 其 中 早 的 任务 先 于 迟 的 任务 ， 且 按期 最 
的 非 降 序 对 早 任 务 进行 调度 。 为 了 做 到 这 点 ， 我 们 将 调度 安排 成 时 任务 忧 先 形 式 . 然后 ， 只 
要 在 该 调度 中 有 两 个 分 别 完成 于 时 间 k 和 k+1 的 早 任务 1 和 j 使 得 机 < 十 ， 我 们 就 交换 1 和 j 
的 位 置 。 因 为 在 交换 前 任务 j 是 早 的 、K+1 近 刷 。 所 以 ，k+li 和 册 ， 且 任务 在 交换 之 后 仍然 
.是 时 的 。 任 务 } 被 移 到 了 调度 中 的 更 前 位 置 ， 故 它 在 交换 后 也 仍然 是 早 的 。 
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如 此 ， 寻 找 最 优 调 度 的 问题 就 成 为 找 一 个 由 最 优 调 庆 中 早 的 任务 构成 的 集合 A 的 向 
题 。 一 且 A 被 确定 后 ， 就 可 按期 限 的 非 降 序列 出 A 中 的 所 有 元 素 ， 从 而 给 出 真正 的 调度 ， 
然后 按 任意 顺序 列 出 退 的 任务 ( 朗 S-A)， 就 可 产生 出 最 优 调 度 的 一 个 规范 次 序 。 

称 一 个 任务 的 集合 A 是 独立 的 ， 如 果 存 在 关于 A 中 任务 的 一 候 调 度 使 得 没有 一 个 任务 
是 迟 的 。 很 显然 ， 某 一 调 庶 中 早 任务 的 集合 就 构成 了 一 个 独立 的 任务 集 。 设 工 表示 由 鹿 有 和 独 
立 的 任务 集 构 成 的 集合。 

考虑 一 下 确定 一 给 定 任 务 集 & 是 否 是 独立 的 问题 。 对 t= 1.2…m， 设 NA) 表 了 入 中 
的 期 限 为 1 或 更 旱 的 任务 的 个 数 。 

引 理 19.tL 对 任意 的 任务 集 A、 下 列 命题 是 等 价 的 : 

1. 集 合 A 是 独立 的 ; 

2. 对 t= 12 10， 有 NA) 反 恒 

3. 如 果 对 A 中 任务 按期 昭 的 非 降序 进行 调度 ， 则 没有 一 个 任务 是 迟 的 。 

证 明 : 显然 ， 如 果 对 某 个 t+ 有 NA)>t， 周 无 法 为 集合 A 做 出 一 个 没有 迟 的 任务 的 调 
度 ， 这 是 因为 有 多 于 t+ 个 任务 要 在 时 间 t 之 前 完成 ， 因 而 ，(1) 就 和 蔓 含 了 (2)。 如 条 人 2) 成 这 ， 
则 (3) 也 必然 成 立 : 当 按 期 限 的 非 降序 进行 调度 时 ， 不 可 能 出 现任 何 问题 ， 因 为 (2) 隐 售 着 党 
大 期 跟 至 多 在 时 间 i 处 ， 最 后 ，(3) 草 含 (1) 是 显 兄 的 ， 
利用 引 理 17.11， 我 们 可 以 很 闪 易 地 判断 一 个 给 定 的 任务 集合 是 否 是 独立 的 ( 见 练 寻 
17.5 一 2)。 

最小 化 迟 任 务 的 罚款 之 和 的 问题 与 最 大 化 时 任务 的 罚款 之 和 的 问题 是 一 样 的 。 下面 的 怎 
理 保 证 了 我 们 可 以 用 贫 心 法 来 找 出 共有 最 大 总 罚款 的 独立 任务 集 A。 

定理 17.12 如果 S 是 一 个 带 期 跟 的 单位 时 间 和 任务 的 集合 ， 且 工 为 所 有 独立 的 任务 集 构 
成 的 集合 ， 则 对 应 的 系统 人 了) 是 一 个 矩阵 用 。 

证 明 : 一 个 独立 的 任务 集 的 每 个 子 集 肯 定 是 独立 的 。 为 证 明 交 换 人 性质， 假设 B 和 A 为 
独立 的 任务 集 ， 且 1Bl >iAl. 变 下 为 使 NB<SNCA 成 立 的 最 大 的 t， 因为 
NB)=1B NA)=1Al, 但 |1BI>1AI， 故 必 存 <n， 且 对 krflskjsn 中 的 所 有 有 
NI(B)> NI(A)、 所 以 ，B 中 包含 了 比 A 中 更 多 的 具有 期 限 k+1 的 任务 ， 设 X 为 B-A 中 具 
有 期 跟 k+1 的 一 个 任务 。 另 设 A' = 一 Alitzx 

现在 利用 直 理 17.11 中 前 性 质 2 来 证 明 A' 几 是 独立 的 。 对 1 系 t 和 KK， 有 NA 一 IANA) 
和 5 因为 A 是 独立 的 。 对 K<t<n， 有 JAD) 和 Ni(B) 生 tb 因为 B 是 独立 的 。 所 以 ， 4 是 
独立 的 ， 证 毕 。 

根据 定理 147.10， 我 们 可 用 一 个 贪心 算法 来 找 出 一 个 具有 最 大 权 值 的 独立 的 任务 集 A。 
然后 ， 可 以 设计 出 一 个 以 A 中 的 在 务 作为 其 里 尾 务 的 最 优 调度 来 。 这 种 方法 对 在 单一 处 琨 
器 上 调 度 具 有 期 寂 和 罚款 的 单位 时 间 任 务 来 说 是 很 有 效 的 。 采 用 了 GREEDY 后 这 个 算法 
的 送行 时 间 为 O(a])， 因 为 算法 中 O(o) 次 独立 性 检查 的 每 一 次 都 要 花 D(n) 的 时 章 ( 兄 练习 
17 5-2)。 问 题 .17-3 中 给 出 了 一 个 更 快 的 实现 。 

图 47.7 给 出 了 这 种 调度 问题 的 一 个 例子 。 在 这 个 例子 中 ， 贪 心算 法 选择 了 任务 1.2,3 和 
4， 故 弃 5 和 6， 最 后 接受 任务 7， 最 终 的 最 优 调度 为 

<<2.4,1.3,7.30>> 
总 的 罚款 为 ww;Hws= 50。 
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古 才 二 4 3 和 人 
ti 的 40 和 30 20 上 0 


图 17.7 单 处 理 器 上 带 期 限 和 罚款 的 单位 时 间 任 务 调 度 问题 的 一 个 实例 


如 考 题 


17-1 找 换 硬币 


考虑 用 最 少 的 硬币 数 来 找 n 分 钱 的 向 题 。 

a. 请 给 出 一 个 全 心算 法 ， 使 得 所 换 零 钱包 括 ， 一 关 的 ， 五 分 的 , 二 分 的 和 一 分 的 。 证 明 
所 给 出 的 算法 能 产生 最 优 解 . 

b. 假设 可 换 的 硬币 的 单位 有 chcl……cx。 整 数 ec> 1，kz1。 证 胃 贪 心算 法 总 可 以 产生 一 
个 最 优 解 。 

c. 请 给 出 一 组 使 信心 算法 不 能 产生 最 优 解 的 硬币 单位 。 

17-2 无 坏 子 图 

a. 设 G=(V,E)? 为 一 无 向 图 。 简 用 和 天 阵 胚 的 定义 ， 证 明 伍 站 是 个 垂 阵 胚 ， 有 此 处 AEI 当 
上 充当 和 是正 的 一 个 无 环 子 集 。 

Hb. 关联 矩阵 对 一 个 无 向 图 予 =(V:B) 来 说 就 是 一 个 |IYIx 但 | 的 息 阵 Mi; 如 果 按 e 与 顶点 v 
关联 则 M,.= 1， 否则 M,.=0。 论 证 : M 的 若干 列 是 线性 无 关 的 ， 当 且 仅 当 对 应 的 边 集 是 无 
环 的 。 然 后 ， 利 用 练习 17.4--2 的 结果 来 给 出 对 (3a) 中 的 作 耻 是 个 矩阵 片 的 另 一 种 证 明 ， 

c. 假设 在 一 个 无 向 图 台 = (V,B 中 每 条 边 都 有 一 个 非 负 的 权 值 w(e) 与 之 联系 。 请 给 出 一 
个 可 以 找 出 王 中 其 有 最 天 总 权 值 的 无 环 子 集 的 有 效 算 法 。 

d. 设 马 = (VBE) 为 任 一 有 向 图 ， 且 全 中 被 定义 为 A&TI， 当 上 且 仅 当 A 不 包含 任何 有 向 
环 。 请 给 出 一 个 有 向 图 台 的 例子 ， 使 得 与 之 相 联系 的 系统 (下 ,站 不 是 个 搜 阵 有 凸 。 另 请 具体 谎 
明和 矩阵 肽 定义 中 的 哪些 条 件 不 成 立 。 

二 有 和 图 G (Y) 的 关联 乱 阵 是 一 个 IvIx 的 二 阵 M， 如 果 过 = 丙 开 硕 让 w 则 

: 如 果 边 日 进 人 顶点 v， 则 M,=1 否则 ，M,.=0。 论 证 : 如 果 G 的 一 组 边 是 线 
仁 守 关 的 ， 出 相应 的 边 集中 乐 包 言 有 向 中 

f 由 练习 17.4-2 可 知 ， 任 一 算 阵 的 由 线性 无 关 的 列 集 梅 成 的 集合 是 一 个 乍 阵 吓 。 请 解 
释 为 什么 (d 四 和 (的 结论 不 是 矛盾 的 。 在 一 个 无 环 边 集 概念 和 与 之 相 联 系 的 关联 和 矩阵 中 线性 
无 关 的 列 集 概念 之 间 ， 为 什么 不 存在 一 个 完美 的 对 应 ? 


417-3 调 庶 问 题 的 变形 


考虑 一 下 下 面 给 出 的 用 于 解决 17.5 中 带 期 限 和 罚款 的 单位 时 间 任务 调度 问题 的 _ -个 算 
法 ， 设 所 有 mm 个 时 间 空 位 开始 时 都 是 空 的 ， 其 中 空位 i i 是 终 引 于 时 间 i 的 单位 长 度 时 间 空 
位 。 我 们 按 罚 款 的 单调 递减 的 顺序 来 考虑 各 个 任务 。 在 考虑 任务 j 时 ， 如 果 有 一 个 恰 处 于 或 
前 于 j 的 期 限 d 的 时 间 空 位 仍 是 空 的 ， 则 将 任务 j 赋 与 最 近 的 这 样 的 宅 位 ， 并 十 人 。 如 果 不 “ 
存在 这 样 的 空位 ， 则 将 任务 j 赋 与 一 个 还 未 被 占 的 、 最 近 的 空位 ， 

a. 论 证: 这 个 算法 总 能 给 册 一 个 最 优 解 。 
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b. 利用 22.3 节 中 的 快速 分 离 集合 森林 米 有 效 地 实现 这 个 算法 。 假 设 已 按 罚 数 的 严格 递 
减 序 对 输入 任务 集合 进行 了 排序 ， 请 分 析 所 给 出 的 实现 的 运行 时 间 。 


练习 十 七 


17.1~1 请 给 出 一 个 基于 选 代 计 算 mifi= 12,…:) 的 解 洋 活动 选择 疝 题 的 动态 程序 设计 算法 。 此 处 mi 
为 包含 活 动 {1.2… 让 中 茹 窜 活动 的 最 大 集合 的 大 小 。 假 设 输 人 都 已 像 (17.1) 式 中 堵 样 排 了 序 。 另 比较 所 给 出 
的 算法 与 GREEDY 一 ACTIVITY-SELECTOR 的 运行 时 间 . 

17.1-2 假设 要 用 很 刻 个 教 宣 对 一 组 活动 进行 调度 。 我 们 的 希 秘 是 用 尽 可 能 少 的 教室 来 调度 所 有 的 医 
动 ， 请 给 出 一 个 有 效 的 贪心 算法 来 确定 哪 一 个 活动 庶 使 用 哪 -一 个 教室 。 

(这 个 问题 也 被 称 为 区 了 间 图 着 色 问 题 。 我 们 可 作出 一 个 区 间 图 ， 其 顶点 为 已 知 的 活动 ， 其 边 连接 不 兼容 
的 活动 。 为 使 任 两 全 顶点 的 颜色 均 相 相同 所 需 的 最 少 蒋 色 数 对 应 于 找 出 调度 给 定 的 所 有 活动 所 短 的 量 少 教 
室 数 。) 

17.1-3 并 不 是 任何 用 来 解决 活动 选择 问题 的 贪心 算法 都 能 给 出 兼容 活动 的 最 大 集合 的 。 请 给 出 一 个 
例子 ， 说 明 那 种 在 与 已 选 出 的 活动 兼容 的 活动 中 选择 生存 期 最 氟 的 那些 的 方法 是 行 不 通 的 。 对 那 种 总 是 选 
择 与 余下 的 锋 动 重 伍 最少 的 活动 的 做 法 ， 情 沈 又 怎样 呢 ? 


17.2-1 证 明 ;， 部 分 彰 包 问题 具有 颌 心 选择 性 质 。 

17.2-2 请 给 出 一 个 解决 0-1 背包 问题 的 运行 时 间 为 0(nW) 的 动态 程序 设计 解 ， 此 处 mn 为 物 贞 的 件 
数 ，WW 为 窃贼 下 放 和 人 他 的 背包 中 的 物品 的 节 大 重量 。 

17.2-3 ”假设 在 0-1 申 背包 问题 中 ， 接 递增 电 主 所 排 的 物品 的 次 序 与 按 递 降 价值 所 排 的 次 床 一 样 。 请 
给 出 能 给 出 的 背包 问题 的 这 个 变形 的 最 优 解 的 一 个 有 效 算 法 ， 并 说 明 其 正确 性 。 

17.2-4 某 人 开车 从 南京 到 上 海 ， 汽 车 的 铀 箱 在 装 满 时 能 用 n 蛙 ; 他 带 了 一 张 地 图 ， 上 面 标 出 了 使 德 可 
以 确定 各 加 油 站 之 间 的 距离 ， 他 希望 路 上 尽量 少 停 几 个 加 油 站 。 请 给 出 一 个 有 效 的 方法 ， 一 路 使 他 可 以 确 
定 应 该 在 娜 凡 个 加油 请 停 下 来 。 证 明 所 给 出 的 策略 能 产生 -= 个 最 优 解 .。 _ 

17.2-5 ”请 描述 一 个 有 效 的 算法 ， 使 之 对 给 定 的 一 实数 轴 上 点 的 集合 fx，x，…，zx}， 能 确定 包含 所 
有 给 定点 的 晤 小 的 单位 长 度 闭 区 间 和 集合 。 证明 所 给 出 的 竺 法 的 平 确 性 。 


17.3~1 证 明 : 一 标 不 满 的 二 允 树 不 订 能 与 一 种 最 优 前 组 编码 对 应 。 

17.3-2 ”对 下 面 的 频 度 入 合 (基于 8 个 辈 波 那 契 数 )， 其 最 优 的 险 夫 总 编码 是 什么 ? 

8: 1，b: 1，ec 2 d 3，e: 和 全 3，g: 13，h: 21 

能 将 答案 推广 到 前 n 个 斐 波 那 架 数 吗 ? 

17.3-3 ”证明 :对 应 于 某 种 编码 的 树 的 总 姑 丛 也 能 通过 计算 所 有 内 节点 的 两 个 子 节 点 的 频 度 之 和 而 得 
到 。 

17.3-4 ”证明 : 对 一 种 最 优 编码 ， 如 果 按 各 字符 的 频 度 的 非 遂 增 序 对 它们 进行 排 震 ， 则 它们 的 编码 长 
度 也 是 非 递 塔 的 ， 

17.3-5 设 C= 10,1…n-4 为 一 字符 集合 。 证 二: C 上 的 任意 一 种 东 优 前 入 缩 码 蝇 可 由 20 tn 1 
a 1 个 位 的 序列 来 表示 。( 提 示 : 用 2n- -1 位 来 说 明 检 的 结构 ) 
17.3-6 将 哈 夫 显 编 玛 推广 至 三 进 制 编码 ( 亦 即 ， 用 符号 0.1.2 来 编码 )， 并 证 明 它 能 产生 最 优 编 权 . 

17.3-7 ”假设 某 一 数据 文件 包含 一 系列 的 8 位 字符 ， 上 日 所 有 256 个 字符 的 频 度 都 差 林 多: 最 大 字符 频 
度 不 到 最 小 字符 频 度 的 两 倍 。 证 明 : 这 种 情况 下 险 夫 曼 编 码 的 效率 与 普通 的 8 位 固定 长 度 编码 就 差不多 
了 ， 

17.3-8 证 明 ;， 没有 一 种 数据 压缩 方案 能 对 包含 随机 选择 的 8 位 字符 的 文件 作 任 何 压 绾 。( 提 示 :; 将 文 
件数 与 可 能 的 编码 文件 数 进 行 比 较 )。 
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17.4-1 和 诈 册 :4S, 呈 是 个 失 竹 及 ， 其 中 S 为 任意 有 穷 香 合 ， 为 由 S 的 所 有 大 小 至 多 为 下 的 子 华 构成 
的 并 合 ， 帮 云 从 |。 

17.4-2 * 和 绪 定 一 个 上 xn 的 实数 答 阵 T， 这 明 个 天 是 个 短 阵 对， 其 中 8 为 下 的 所 有 列 构 成 的 集合 ， 
且 上 EE 当 县 仅 当 上 中 各 列 是 线性 无 关 的 ， 

17.4-3 * 证 明 : 如 备 ($. 员 是 一 个 矩阵 且 ， 则 ($,19 也 是 一 个 矩阵 胚 ， 此 处 工 > {A SA 包含 某 个 最 
大 的 和 EC 革 ， 亦 郊 ，(S 的 最 大 独立 子 旧 是 (S 玉 的 最 大 独立 子 集 的 补 集 。 

17.4-4 * 设 S 为 -- 有 穷 集 侣 ， 有 是 SS 为 将 S 分 成 非 空 的 不 相交 子 集 的 一 个 划分 结构 从 如 由 
茶 件 = 护 : 候 站 S 和 44= 12…: 匡 来 定 广 。 请 证 明 司 ,是 个 宣 阵 脏 ， 亦 即 ， 由 划分 的 每 个 块 中 上 志 含 至 多 一 
咎 成 员 的 集合 点 构成 的 集合 诀 定 了 一 个 矩阵 吓 的 独立 集合， 

17.4-5 .说明 在 最 优 解 为 具有 最 小 权 介 的 最大 独立 子 集 的 加 权 和 矩 竹 胚 问 题 中 ， 如 何 改造 其 权 冰 数 使 之 
成 为 一 个 标 鸠 的 加 权 上 矩阵 且 同 感 。 另 请 论证 所 作 的 改造 是 正确 的 . 


17.5-~1 和解 儿 17.7 中 调 摩 向 题 的 情 ， 但 要 将 每 个 站 款 符 摘 成 80-wi。 
17.5-2 ”说明 站 语 利 用 引 理 17.1 的 性 项 2 来 在 OUA[) 时 间 内 俩 定 一 个 给 定 的 任务 集 A 是 否 是 独立 的 。 


第 十 八 童 “ 平 捧 分 析 


在 平 捧 分 析 中 ， 执 行 一 系列 数据 结构 操作 所 需要 的 时 间 是 租 过 对 执行 的 所 有 操作 求 平均 
面 担 出 的 。 平 排 分 析 可 用 来 证 其 在 一 系列 操作 中 ， 即 使 单一 的 操作 具有 较 大 的 代价 、 通 过 对 
所 有 操作 求 平 均 后 ， 平 均 代 价 还 是 很 小 的 。 平 捧 分 析 与 平均 情况 分 析 的 不 同 之 处 在 于 它 不 棕 
涉 到 梳 率 ， 这 种 分 析 保 证 了 在 最 坏 情 说 下 每 个 操作 共有 平均 性 能 。 

本 章 的 前 三 节 要 介绍 平 捧 分 析 中 最 常用 的 三 种 技术 。18.1 节 首 先 介绍 紊 案 方法 。 我 妇 
可 以 用 这 种 方法 确定 一 个 nm 个 操作 的 序列 的 总 代价 的 上 界 T(aj。 每 个 操作 的 平 摊 代 价 可 表 
二 为 了 (nj mn。 

18.2 节 介 绍 会 计 方法 ， 用 它 可 确定 每 个 操作 的 平反 代价 。 当 有 一 种 以 上 的 操作 时 ， 每 
种 操作 都 可 有 -一 个 不 罗 的 平 捧 代 价 ， 这 种 方法 对 操作 序列 中 的 某 些 操作 先 “多 记 帐 "， 将 多 记 
的 部 分 作为 对 数据 结构 中 的 特定 对 象 上 预付 的 存款 存 起 来 。 在 该 序列 中 稍 后 要 用 到 这 些 存款 
以 补偿 那些 对 它们 证 的 “ 帐 " 少 于 其 实际 代价 的 操作 . 

18.3 节 介 绍 “势能 方法 "， 它 与 会 计 方 法 的 相似 之 处 在 于 要 确定 每 个 操作 的 代价 ， 且 先 
对 某 些 操作 老 记 帐 以 补偿 以 后 的 不 是 记 帐 。 这 种 方法 将 存 数 作为 数据 结构 的 “势能 "来 维护 ， 
而 不 是 将 存款 与 数据 结 梅 中 的 单个 对 象 联系 起 来 。 

我 们 将 用 两 个 例子 来 说 明 这 三 个 模型 。 第 一 个 例子 是 个 栈 ， 它 有 一 个 新 的 操作 
MULTIPOP， 它 可 一 次 阐 出 儿 个 对 象 。 另 一 个 例子 是 个 二 进 计数 器 ， 它 利用 操作 HTN- 
CREMENT 从 0 开始 计数 。 

”在 赔 读 本 章 时 ， 读 者 应 记 住 在 平 排 分 析 中 所 记 的 “ 帐 "只 是 为 了 分 析 之 用 ， 它 们 不 庶 出 现 
在 代码 中 。 例 如 ， 当 在 采用 会 计 方法 时 ， 奶 果 将 一 存款 赋予 一 个 对 象 ， 在 代码 中 就 没有 上 几 要 
对 某 属 性 credittx] 赋 一 个 相应 的 值 了 。 

通过 租 平 摊 分 析 而 获得 的 对 某 种 数据 结构 特性 的 认 设 有 助 于 优化 设计 ，。 例 如， 在 18.4 
中 ， 我 们 将 用 势 估 方 法 来 分 析 一 个 动态 y 于 和 收 军 扑 表 。 


18.1 来 集 方法 “ 


在 平 排 分 析 的 形 集 方法 中 ， 我 们 要 证 明 对 所 有 的 n，n 个 操作 档 成 的 序列 在 最 坏 情 况 下 
总 的 时 间 为 Ttm)j。 在 最 坏 情况 下 ,每 个 操作 的 平 排 代价 就 为 T(mj 7 na。 请 注意 这 个 平 捧 代 价 
对 每 个 操作 都 是 成 立 的 ， 即 使 当 序列 中 存在 儿 种 类 型 的 操作 时 也 是 一 样 的 。 本 章 中 要 研究 的 
另 两 种 方法 ( 即 会 计 方法 和 势能 方法 ) 对 不 同类 型 的 操作 虽 可 能 赋予 不 同 的 平 捧 代 价 。 


栈 扎 作 


在 关于 聚集 方法 的 第 一 个 例子 中 ， 我 们 要 来 分 析 增 如 了 一 个 新 操作 的 栈 。 在 11.1 节 中 
我 们 已 经 介绍 了 两 种 基本 的 栈 操作 ， 每 个 的 时 间 代 价 都 是 COL: 
一 241-- 


PUSHILS,X): 将 对 象 X 讨 人 栈 $; 
POP(S): 弹出 并 返回 $ 的 顶端 元 素 ， ， 
因为 这 两 个 操作 的 运行 时 间 都 为 O(D)， 故我 们 可 把 每 个 操作 的 代价 视 为 1。 这 样 ， 一 个 
n 个 PUSH 和 POP 操作 的 序列 的 总 代价 就 为 a， 而 这 个 操作 的 实际 运行 时 间 就 为 @(m。 
如 果 再 增加 一 个 栈 操作 MULTIPOP(S,I)， 则 情况 会 变 得 更 有 趣 。 该 操作 去 掉 S 的 k 个 
顶端 对 象 ， 或 当 它 包含 少 于 上 个 对 象 时 弹出 整个 栈 ， 在 下 面 的 伪 代 玛 中 ， 如果 当前 富 中 没 
有 对 象 则 操作 STACK-EMPTY 返回 TRUE， 否则 它 返 回 FALSE， 
MULTIPOP(S,k) 
1 while Got STACK-EMEPTYIS) and km0 
2 do POPIS) 
了 K= 一 kk 一 ] 
图 18.1 示 出 了 MULTIPOP 的 一 个 例子 , 初始 情况 见 (ay。 最 上 面 的 四 个 对 象 由 
MULIIPOP (3S$，4) 弹出 ， 其 缚 果 如 (bj 中 所 示 。 下 一 个 操作 是 MULTIPOP(S，7)， 它 
将 栈 清空 -一 如 〈c) 中 所 示 - 因为 余下 的 对 象 已 不 足 七 个 。 
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图 18.1 _ MULTIPOE 作 用 于 楼 S [的 动作 


MULTIPOP(S,k) 作 用 于 一 个 包 售 s 个 对 象 的 栈 上 的 运行 时 间 怎 样 呢 ? 实际 的 运行 时 间 
与 实际 执行 的 POP 操作 数 成 线 件 关系 ， 因 而 只 要 按 PUSH 和 POP 具有 抽象 代 优 1 来 分 析 
MULTIPOP 就 是 够 了 。 代 码 中 while 循环 执行 的 次 数 即 从 栈 中 弹出 的 对 象 数 minfs,. 七 。 对 
该 循环 的 每 一 次 执行 ， 在 第 2 行 中 都 要 调用 一 次 POP。 这样，MULTIPOP 的 总 代价 即 为 
mintts:Jo0， 而 实际 运行 时 间 则 为 这 个 代价 的 一 个 线性 函数 。 

现在 来 对 作用 于 一 个 初始 为 空 的 栈 直 的 ma 个 PUSH，POP 和 MULTIPOP 操作 构成 的 
序列 作 个 分 析 。 序 列 中 一 次 MULTIPOP 操作 的 最 坏 情况 代价 为 On)， 因 为 栈 的 大 小 至 客 
为 0。 这 样 ， 任 意 栈 操作 的 最 坏 情况 时 间 就 是 D(n)， 而 5 个 操作 的 总 代价 就 是 Ona2)， 因 为 
MULIIPOP 操作 可 能 会 有 On 个， 每 个 的 代价 为 D(m。 虽 然 这 个 分 析 是 正确 的 ， 但 通过 
分 析 每 个 操作 的 最 杯 情况 代价 而 得 的 O(n) 结 论 却 是 不 够 紧 确 的 

利用 平 摊 分 析 中 的 聚集 方法 ， 我 们 可 以 获得 一 个 考虑 到 了 整个 操作 序列 的 更 好 的 上 界 。 
事实 上 ， 虽 然 某 一 次 MULTIPOP 操作 的 代价 可 能 较 高 ， 但 作用 于 初始 为 空 的 栈 上 的 任意 
一 个 包含 mn 个 PUSH，POP 和 MULTIPOP 操作 的 序列 的 代价 至 多 为 On)。 为 什么 会 是 这 
样 呢 ? 一 个 对 象 在 每 次 被 讨伐 后 至 多 被 弹出 一 次 。 所 以 ， 在 一 个 非 空 栈 上 调用 POP 的 次 
数 (包括 在 MULTIPOP 内 的 调用 ) 至 多 等 于 PUSH 操作 的 次 数 ， 即 至 多 为 mn， 对 任意 的 mn 
值 ， 包 含 n 个 PUSH，POP 和 MULTIPOP 操作 的 序列 的 总 时 间 为 Dom。 据 此 ， 每 个 操作 
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的 平反 代价 为 : DOm yn=eGl)。 . 

我 们 想 再 一 次 独 调 一 下 ， 昌 然 我 们 已 说 明了 每 个 栈 操 作 的 平均 代价 (或 平均 运行 时 间 ] 为 
OLD， 但 没有 用 到 任何 槛 率 推 理 。 实 际 上 是 给 出 了 一 列 了 个 操作 的 最 坏 情 况 界 O(p)。 用 D 
来 除 这 个 总 代价 即 可 得 每 个 操作 的 平均 代价 (或 说 平反 代价 )。 


二 进 计 数 睫 


作为 聚集 方法 的 另 一 个 例子 ， 考 虑 实现 一 个 由 人 开始 向 上 计数 的 k 位 二 进 计 数 朵 的 问 
题 。 我 们 用 一 个 数组 Al0.k-1]( 此 处 length[A]= 如 作为 计数 器 。 存 储 在 计数 器 中 的 一 个 二 进 
数 x 的 最 低位 在 AI] 中， 最 高 位 在 A[k-1 中 ， 故 x= 守 ，, A 国 .2 。 

开始 时 ，x=0， 故 和 [和 = 0i= 和 0( 即 i= 0 1, ,kk 一 ]…k 一 1。 为 将 计数 器 中 的 值 加 1 工 ( 模 
29， 我 们 可 用 下 面 的 过 程 : 

INCREMENTLA) 

] “= 

2 wiile i<length[a] and 入 加 = 
3 do 页 [| 

十 ii 十 { 

S 让 <lengtt[A]， 

厂 then 和 和 -一 1 

这 个 算法 与 硬件 实现 的 行 波 进位 计数 器 基本 上 是 一 样 的 { 胸 29.2.1 节 )。 图 18.2 示 出 了 一 
个 二 进 计 数 器 从 0 至 16 的 16 次 增值 的 过 程 。 发 生 翻 转 而 取得 下 一 个 值 的 位 都 加 了 阴影 。 右 
按 示 出 了 位 翻转 所 需 的 代价 。 注 意 总 代价 始终 不 超过 INCREMENT 操作 总 次 数 的 两 倍 。 
在 第 2-4 行 中 每 次 while 循环 的 开始 ， 我 们 希望 在 位 置 ;处 如 1。 如 果 A 加 一 1， 册 加 1 后 吉 
将 位 置 ; 处 的 数位 置 为 0， 并 产生 一 个 进位 1， 它 在 循环 的 下 一 次 执行 中 加 到 位 置 计 1 上 ; 
和 否则， 循环 结束 ， 然 后 ， 如 果 i<X， 我 们 知道 A[i=0， 故 将 1 加 到 位 置 1 后 ， 使 和 变 为 1， 
这 在 第 6 行 中 完成 。 每 次 INCREMENT 操作 的 代价 与 被 改变 值 的 位 数 成 线性 关系 。 

像 在 栈 的 例子 中 一 样 ， 大 致 分 析 一 下 只 能 得 到 一 个 正确 但 不 紧 确 的 界 。 在 最 坏 情 况 下 ， 
INCREMENT 的 每 次 执行 要 花 @ 人 时间 ， 此 时 数组 A 中 包含 全 1。 这 样 ， 在 最 坏 情 况 
下 ， 桥 用 于 一 个 初始 为 零 的 计数 器 于 的 na 个 INCREMENT 操作 的 时 间 就 为 Dinijo。 

如 果 我 们 分 析 得 更 精确 一 些 的话 ， 则 奇 得 到 次 INCREMENT 操作 的 序列 的 最 坏 情 
况 代价 为 D(mJ。 关 键 是 要 注意 到 在 每 次 调用 INC&EMENT 中 ， 并 不 是 所 有 的 位 都 发 生变 
化 : 作用 于 初始 为 零 的 计数 器 上 的 次 INCREMENT 操作 导致 A[U 变 化 了 1 av2] 次 。 
类 似 地 ， 位 A[ 人 4 每 师 三 次 发 生变 化 ， 或 在 区 次 INCREMENT 操作 中 共 变 化 1 ny7 44 次 。 
一 般 地 ， 对 i=041,…, 上 起 Dj ,位 AI 在 一 个 作用 于 初始 为 堆 的 计数 器 上 的 王 次 INCRE- 
MENT 操作 的 序列 共 要 翻转 1 ny7y24 次 . 对 i> 【1 地 nJ， 位 A 四 始终 不 发 生变 化 .这样 ， 
在 序列 中 发 生 的 位 规 转 的 总 次 数 为 


用 ] 
-一 所 和 一 
评 二 <a32 


一 20 《 据 式 [3.4 及 
由 此 可 知 ， 作 用 于 一 个 初始 为 零 的 计数 匿 上 的 mn 次 INCREMENT 操作 的 最 坏 情 况 时 
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问 为 Dtpj， 办 而 每 次 操作 的 平反 代价 为 On) va=eQ(T. 


Counter Taetal 
YaJue RONSRILS cost 
心 站 人 DO0000 遇 丰 
tt 000000 直 二 1 
2 四 DOD0Oonoll 机 
3 000000S 4 
轩 00060t0 刀 .7 了 
5 00000001 8? 
看 0 必 首 作 1 1 1 如 
了 好 站 中 性 的 2 这 11 
名 必 们 站 帮 1 00 15 
9 PnP5600f0i 划 16 
10 1 有 001l01 谢 1 生 
11 和 站 站 和 1 的 到 攻 二 ， 
2 六 二 六 帮 1 1 四 2 
1 DoDn0n0liB 33 
Il4 0000111 衣 和 益 
1 0 0 0 26 
16 0tn0on00t 本 ] 


图 1]8.2 在 16 次 INCREMENT 操 作 作 用 下 .一 个 八 位 二 进 计数 器 的 值 从 0 变 到 16 


18.2 会 计 方 法 


在 平反 分 析 的 会 计 方法 中 ， 我 们 对 不 同 的 操作 娠 了 予 木 周 的 费 值 ， 某 些 操作 的 费 值 比 它们 
的 实际 代价 或 多 或 少 。 对 每 一 操作 所 记 的 费 值 即 其 平 拓 代价。 当 一 个 操作 的 平 挫 代价 超过 了 
它 的 实际 代价 革 ， 两 者 的 差 值 就 被 作为 存款 赋 给 数据 结构 中 一 些 特定 的 对 象 。 存 款 可 在 以 后 
用 宇 补 偿 那 些 其 平 摊 代 价 低 于 其 实际 代价 的 操作 。 这 样 ， 我 们 就 可 将 -一 操作 的 平 捧 代 价 填 作 
为 两 部 分 ， 其 实际 代价 与 存款 (或 被 俯 蔷 或 被 使 用 )。 这 与 珍 集 方法 很 不 同 ， 后 者 所 有 操作 都 
具有 相同 的 平 排 代价。 

在 选择 操作 的 平 排 代价 时 是 要 非常 小 心 的 。 如 果 我 们 希望 通过 对 平 排 代 价 的 分 析 说 明 每 
次 操作 具有 较 小 的 最 坏 情况 平均 代价 ， 则 操作 序列 的 总 的 平 捧 代 价 就 必须 是 该 序列 的 总 的 实 
际 代价 的 一 个 上 界 ，。 而 且 ， 像 在 聚集 方法 中 一 样 ， 这 种 关系 必须 对 所 有 的 操作 序列 都 成 立 。 
这 样 ， 与 该 数据 结构 相 联 系 的 存款 始终 应 该 是 非 负 的 ， 因 为 它 表示 了 总 的 平 排 代价 超过 总 的 
实际 代价 的 部 分 。 如 果 人 允许 总 的 存款 为 负 的 话 (开始 时 对 某 些 操作 的 费 值 记 得 过 低 )， 册 在 某 
-- 时 刻 总 的 平 捧 代 价 就 会 低 于 总 的 实际 代价 。 对 到 该 时 刻 为 止 的 操作 序列 来 说 ， 总 的 平 捧 代 
价 就 不 会 是 总 的 实际 代价 的 一 个 上 界 。 所 以 ， 我 们 必须 始终 注意 数据 结构 中 的 总 存款 不 能 是 
负 的 。 


栈 操 作 

为 了 说 明 平 抬 分 析 中 的 会 计 方 法 ， 我 们 再 回 过 头 看 看 栈 的 例子 。 各 栈 操作 的 实际 代价 为 . 
PUSH 1， 
POP 1 
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MULTIPOP TINTK:S) 
其 中 上 为 MULTIPOP 的 一 个 参数 ，s 为 调用 该 操作 时 栈 的 大 小 。 现 对 它们 县 了 予以 下 的 平反 
代价 : 


PUSH 2， 
POP 0， 
MULTIPOP 必 ， 


请 注意 MULTIPOP 的 平 捧 代 价 是 个 常数 0， 而 它 的 实际 代价 却 是 个 变量 。 此 处 所 有 三 
个 平 摊 代 价 都 是 DO(1D)， 但 一 般 来 说 所 考虑 的 各 种 操作 的 平 摊 代 价 会 渐 近 地 变化 。 

现在 我 们 来 说 明 只 需要 用 平 捧 代 价 就 可 支付 任何 的 栈 操作 序列 。 候 设 我 们 用 1 元 钱 来 表 
示 代 价 的 单位 。 开 始 时 栈 是 空 的 。 栈 数据 结 攀 与 在 餐馆 中 一 堆 迁 放 盘 于 的 类 做。 当 将 一 个 盘 
子 压 人 堆 上 时 ， 我 们 用 !1 元 来 支付 该 压 人 动作 的 实际 代价 ， 并 有 1 元 的 存款 ( 记 的 是 2 元 的 
帐 )， 将 该 1 元 钱 放 在 刚 压 人 的 邢 子 的 上 面 。 在 任何 一 个 时 间 点 上 ， 纵 中 每 个 盘子 的 上 耐 都 
有 !1 元 钱 的 余 款 。 

盘 中 所 存 的 钱 是 用 来 预付 将 盘 从 栈 中 弹出 所 带 代 价 的 。 当 我 们 在 执行 了 一 个 POP 操作 
时 ， 对 该 操作 不 轴 收 任何 费 ， 只 要 用 盘 中 所 存放 的 余 款 来 支付 其 实际 代价 即 可 。 为 弹出 一 个 
盘子 ， 我 们 拿 掉 该 盘子 上 的 1 元 余 款 ， 并 用 它 来 支付 弹出 操作 的 实际 代价 。 这 样 ， 在 对 
PUSH 操作 多 收 了 一 点 费 后 ， 就 无 疯 对 PDP 操作 收 任何 费 。 

更 进一步 ， 我 们 对 MULTIPOP 操作 也 无 需 收费 。 为 弹出 第 一 个 盘子 ， 我 们 取出 其 中 
的 1 元 余 款 并 用 它 支付 一 次 POP 操作 的 实际 代价 。 为 弹出 第 二 个 盘子 ， 再 取出 该 盘 寺 的 1 
元 余 款 来 支付 第 二 次 POP 操作 ， 等 等 。 这 样 ， 对 任意 的 包含 n 次 PUSH，POP 和 
MULTIPOP 操作 的 序列 ， 总 的 平 摊 代 价 就 是 其 总 的 实际 代价 的 一 个 上 界 。 又 因为 总 的 平 捧 
代价 为 DIn)， 故 总 的 实际 代价 也 为 Din)。 


二 进 计数 器 的 增 侦 


为 进一步 说 明 会 计 方 法 ， 我 们 青 来 分 析 一 下 作用 于 一 个 初始 为 0 的 二 进 计数 器 上 的 
INCREMENT 操作 。 我 们 前 面 已 经 说 过 ， 这 个 操作 的 运行 时 了 间 与 发 生 翻转 的 位 数 是 成 正比 
的 ， 而 位 数 在 本 讽 中 即 为 代价 。 我 们 还 是 用 1 元 钱 来 表示 单位 代价 (此 例 中 即 为 某 一 位 的 翻 
转 )。 

为 进行 来 捧 分 析 ， 我 们 规定 对 将 某 一 位 置 为 1 的 操作 收取 2 元 的 平反 痪 几 。 当 基数 位 被 
置 定 后 ， 我 们 用 2 元 中 的 1 元 来 支付 喃 在 操作 的 实际 代价 ， 而 将 另 1 元 存在 该 位 上 作为 祭 
款 ， 在 任何 时 间 点 上 ， 计 数 器 中 每 个 1 上 都 有 !1 元 余 款 。 这 样 在 将 某 位 复位 成 0 时 不 用 付 任 
何 费 ， 只 要 取出 该 位 上 的 工 元 余 款 即 可 。 

现在 就 可 以 来 确定 INCREMENT 的 平 肉 代价 了 。 在 while 福 环 中 复位 操作 的 代价 是 由 
有 关 位 土 的 余 款 来 支付 的 。 在 INCREMENT 的 第 6 行 中 至 志 有 一 位 被 复位 ， 所 以 一 次 
INCREMENT 操作 的 代价 至 多 为 2 元 。 又 因为 计数 器 中 为 1 的 位 数 始 终 是 非 负 的 。 故 其 中 
总 的 余 款 额 也 是 非 负 的 。 对 nn 次 INCREMENT 操作 ， 总 的 平 摊 代 价 为 Dm， 这 就 给 出 了 
总 的 实际 代价 的 一 个 界 。 


18.3 ”势能 方法 


笠 捧 分 析 中 的 势能 方法 不 是 将 已 预付 的 工作 作为 存储 在 数据 结构 特定 对象 中 的 存款 来 表 
示 ， 而 是 表示 成 一 种 “势能 "， 或 “ 势 *， 它 在 需要 时 可 释放 出 来 以 支付 后 面 操作 的 代价 。 势 是 
与 整个 数据 结构 而 不 是 其 中 的 个 别 对 象 发 生 联 系 的 。 

势能 方法 的 工作 过 程 是 这 样 : 开始 时 先 对 一 个 初始 数据 结构 Dj 执行 a 个 操作 。 对 每 个 
i= 12…n， 设 为 第 i 个 操作 的 实际 代价 ，DD, 为 对 数据 结构 D，, 作用 第 i 个 操作 的 结果 ， 
势 函数 中 将 每 个 数据 结构 D; 映射 为 一 个 实数 BID)， 即 与 数据 结构 D 相 联系 的 势 第 ji 个 
操作 的 平 捧 代 价 c 定 尽 为 ， 

ci =c 十 @D) 一 bD ) (18. 了 ) 

从 这 个 式 子 可 以 看 出 ， 每 个 操作 的 平 排 代价 为 其 实际 代价 加 上 由 于 该 操作 所 增加 的 势 

根据 等 式 (18.0)，n 个 操作 的 总 的 平 捧 代 价 为 : 


zc 一 zc + GOD) 一 D， 少 


= >。 +OD) 一 DOD) (18.2) 
第 二 步 推导 由 等 式 (3.7) 可 得 ， 因 为 (DJ) 是 套 枉 的 。 
如 果 我 们 能 定义 一 个 势 函 数 由 使 得 @(Dj)>@(Dsj， 则 总 的 平 排 代价 并” c 就 是 总 的 实 


际 代价 的 一 个 上 界 。 在 实践 中 ， 我 们 并 不 总 是 知道 寺 执 行 多 少 个 操作 ， 所 以 ， 如 果 要 求 对 所 
有 ji 有 @(DJ) 关 GDoj， 则 就 应 像 在 会 计 方法 中 一 样 ， 保 证 预先 支付 。 通 常 为 了 方便 起 见 ， 我 
们 定义 中 (Do 为 0， 然 后 再 证 明 对 所 有 i 有 和 (Dj) 关 (练习 18.3 一 1 中 给 出 了 一 种 处 理 @(Duj 产 
0 时 各 种 情况 的 简单 方法 )。 

从 直觉 上 看 ， 如 果 第 i 个 操作 的 势 差 Di 一 (Di 是 正 的 ， 则 平反 代价 c, 就 表示 对 第 i 
个 操作 多 收 了 费 ， 同 时 数据 结构 的 势 也 随 之 增加 了 。 如 果 势 差 是 负 的 ， 风干 挫 代 价 就 表示 对 
第 i 个 操作 的 不 足 收 费 ， 这 时 就 可 通过 减少 势 来 支付 该 操作 的 实际 代价 。 

电 等 式 (18.0 和 (18.2) 所 定义 的 平 排 代 价 依赖 于 所 选择 的 势 未 数 中 。 不 同 的 势 函数 可 能 会 
产生 不 同 的 平反 代价 ， 但 它们 都 是 实际 代价 的 上 界 。 在 选择 一 个 势 函 数 时 常 要 作 一 些 权衡 ， 
可 选用 的 最 佳 势 函数 的 选择 要 取决 于 所 需 的 时 间 界 . 


校 所 作 


为 了 说 明 势 能 方法 ， 我 们 再 一 次 来 研究 一 下 栈 操作 PUSH,POP 和 MULTIPOP， 定义 
栈 上 的 势 函 数 中 为 析 中 对 象 的 个 数 。 开 始 时 我 们 要 处 理 的 是 空 栈 Do， 且 @(Do=0。 因为 栈 
二 的 对 象 数 始 终 是 非 负 的 ， 故 在 第 i 个 操作 之 后 的 栈 Di 就 具有 非 负 的 势 ， 且 有 


=@D) 


以 下 表示 的 nm 个 桔 作 的 平 捧 代 价 的 总 和 就 表示 了 实际 代价 的 一 个 上 界 。 
现在 我 们 来 计算 各 找 操 作 的 平 捧 代 价 。 邵 果 作 用 于 一 个 包含 s 个 对 象 的 栈 上 的 第 i 个 操 
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作 是 个 PUSH 操作 ， 册 势 差 
也 ) 一 中 (D， 1 贡 一 3 


一 了 
根据 等 式 (18.1)， 该 PUSH 操作 的 代价 为 
c =c+GDJ)-oD ) 
一 1 二 1! 
一 2 
假设 第 i 个 操作 是 MULTIPOP(S,k)， 且 弹出 了 k = min(ks) 个 对 象 。 该 操作 的 实际 代 
价 为 K， 势 差 为 
GD ) 一 DID )= 一 区 
这 样 ，MUELTIPOP 操 作 的 平反 代价 为 
c =c+D)-oOD  ) 
一 区 一 区 
. 一 和 
类 似 地 ，POP 操作 的 平反 代价 也 是 0。 
兰 种 楼 操作 中 每 一 种 的 平反 代价 都 是 OLD， 这 样 包含 mn 个 抬 作 的 序列 的 总 平 捧 代 价 就 
是 DIm。 因 为 我 们 已 经 证 明了 B(DjJ)z>d0Do， 故 和 个 操作 的 总 平 据 代 价 即 为 总 的 实际 代价 
的 一 个 上 界 。 这 样 nm 个 操作 的 最 坏 情 况 代 价 为 DUn)。 


二 进 计数 路 的 增值 


作为 说 明 势 能 方法 的 另 一 个 例子 ， 我 们 再 来 看 看 二 进 计 数 器 的 增值 问题 。 这 一 次 ， 我 们 
定义 在 第 1 次 INCREMENT 操作 后 计数 器 的 势 为 b， 即 第 i 次 操作 后 计数 器 中 1 的 不 数 。 
我 们 来 计算 一 下 一 上 次 INCREMENT 操作 的 平 挫 代 价 。 假 设 第 i 次 INCREMENT 操作 
对 1 个 位 进行 了 复位 。 该 操作 的 实际 代价 至 多 为 tt+1， 因 为 除了 将 个 位 复位 外 ， 它 至 多 将 
一 位 置 成 1。 所以， 在 第 i 次 操作 后 计数 器 中 1 的 个 数 为 么 b_i 一 6+1， 势 差 为 
dID ) 一 GD _ )< 和 tb 一 t 二 也 一 b， 
一 一 直 
平 摊 代 价 为 ， 
c =c +eD) 一 ID  ) 
扫 导 十 蕊 十 圭一 上 
一 2 
如 果 计 数 器 开始 时 为 0， 则 @(Dy=0。 因 为 对 所 有 工 有 0UDD2>0， 故 次 INCRE- 
MENT 操作 的 序列 的 总 平 排 代 价 就 为 总 的 实际 代价 的 一 个 上 界 ， 且 mn 殉 INCREMENT 操 
作 的 最 坏 情 况 代 价 为 On)。 
势能 方法 给 我 们 提供 了 一 个 简易 方法 来 分 析 开 始 时 不 为 零 的 计数 器 。 开 始 时 有 bu 个 
1， 在 n 次 INCREMENT 和 作 之 后 有 b, 个 1， 此 处 0 过 bu，b, 和 kk。 我 们 可 将 等 式 (18.2) 重 
与 为 
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Ze=2c 一 DO)+dD ) (18.3) 


对 所 有 ] si 和 nan 有 6 和 2。 因 为 @(D)=-b，d(D )=b ，n 次 INCREMENT 操 作 
的 总 的 实际 代价 为 
Ye <yY2-b +b 
一 如一 十 b， 
请 注意 因为 b, 舟 kK， 如 果 我 们 执行 了 至 少 mn= no 次 INCREMENT 操作 ， 则 无 论 计 
数 器 中 包含 什么 样 的 初始 值 ， 意 的 实际 代价 都 是 On)。 


18.4 ”动态 雪 


攻 有 些 应 用 中 ， 在 开始 时 无 法 闫 知 要 在 表 中 存储 和 多少 个 对 象 。 可 以 先 为 该 表 分 配 一 定 的 
宝 间 、 查 后 米 很 可 能 会 党 得 不 够 ， 这 样 就 赣 重 新 为 该 表 分 配 一 个 更 大 的 空间 ， 币 表 中 的 对 象 
就 要 复制 到 新 辩 中。 类 亿 地 ， 如 果 有 许多 对 象 被 从 表 中 删 去 了 ， 就 应 该 给 原 表 分 配 一 个 更 小 
的 空间 。 在 这 - 节 里 ， 我 们 要 研究 表 的 动态 扩张 和 收缩 的 问题 。 利 用 平 捧 分 析 ， 我 们 要 证 明 
插入 和 删除 操作 的 平 摊 代 价 为 OU)， 即 使 当 它 们 引起 了 表 的 扩张 和 收 系 时 具有 较 大 的 实际 
代价 也 是 -一 样 的 。 此 外， 我 们 将 看 到 如何 来 保证 某 一 动态 表 中 未 用 的 空间 始终 不 超过 整个 空 
间 的 一 部 分 . 

假设 动态 开支 持 TABLE-INSERT 和 TABLE--DELETE 操作 。TABLE-INSERT 将 
某 一 郊 素 插入 表 中 ， 该 元 素 占 据 一 个 槽 ( 即 一 个 元 素 占 据 的 空间 )。 同 样 地 ，TABLE-DE- 
LETE 将 一 个 元 素 从 表 中 去 掉 ， 从 而 释放 了 一 个 构 。 用 来 构造 这 种 表 的 数据 结构 方法 的 网 节 
不 重 归 ; 可 以 选用 的 有 要 (141.1 节 )， 堆 (7.0 节 和 或 杂凑 表 ( 第 十 二 章 ) 结 构 。 我 们 像 在 11.3 节 中 
那样 用 一 个 数组 或 … 组 数组 来 实 更 对 象 存储 。 

大 察 将 会 发 现在 采用 了 第 十 二 章 中 分 析 厅 站 技 术 时 引信 的 装载 因子 概念 后 会 很 方便 。 定 
义 - 一 个 非 守 表 下 的 装载 因子 xDT) 为 表 中 存储 的 对 象 项 数 被 表 的 大 小 ( 覃 的 个 数 ) 除 了 以 后 的 结 
录 。 对 一 个 空 表 ( 其 中 没有 有 元素) 证 义 其 大 小 为 0， 其 装载 因子 为 1， 如 果 某 一 动态 表 的 装载 
内 了 以 一 个 党 数 为 上 界 ， 则 表 中 未 使 用 的 空间 就 始终 不 会 超过 整个 空间 的 一 常数 部 分 。 

我 们 先 开始 分 析 只 对 之 做 插 人 的 动态 绕 ， 然 后 再 考虑 既 多 许 插 人 又 允许 删除 的 更 一 般 的 


18.4.1 袁 的 扩张 


假设 一 个 表 的 和 存储 空间 分 配 为 一 个 槽 的 数组 , 当 所 有 的 槽 都 被 占用 时 一 个 表 就 被 填 满 了 ( . 
这 册 ， 项 疲 载 因子 为 D。 在 某 些 软件 环境 中 ， 如 果 坛 图 向 一 个 满 的 表 中 揪 人 一 个 项 ， 就 只 
公 导 仇 铺 误 。 此 处 息 设 我 们 的 软件 环境 ( 像 许多 现代 的 软件 环境 一 样 ) 提 供 了 存储 管理 系统 ， 
亡 能 申根 据 请 求 来 分 配 或 释放 存储 块 ， 这 样 ， 当 向 一 满 的 表 中 插 人 一 个 项 时 ， 我 们 就 能 对 原 
表 进 行 扩张 ， 即 分 配 一 个 包含 比 原 表 更 多 的 槽 的 新 表 ， 再 将 原 表 中 的 各 项 复制 到 新 表 中 去 。 
一 种 常用 的 置 发 式 靶 术 是 分 本 一 个 比 原 表 太一 倍 的 新 表 。 如 果 只 对 表 执 行 搬 人 操作 ， 则 
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表 的 装载 因子 总 是 至 少 为 1/2， 这 样 浪费 掉 的 空间 就 始终 不 会 超 进 表 总 室 间 的 一 半 . 
在 下 面 的 伪 代 码 中 ， 我 们 假设 对 象 了 表示 一 个 囊 。 碟 ablefT] 包 含 了 一 个 指向 表示 表 的 
存储 块 的 指针 ， 域 num[ 人 包含 了 表 中 的 项 数 ， 域 size[T] 为 表 中 总 的 槽 数 。 开 始 时 ， 表 是 空 
的 : num[T]= size[Tj=m0 
TABLE-INSERTIT,x) 
1 这 size[I] = 
2 then atiocate tabtefT] with 1siot 
size[T]- 一 1 

imnum[T]= size[T] 

thenm #llocate new tabje with 2 Size[ 本 slots 
insetrt al]] items im table[T] jnto new 一 tb 
free table[T] - 
tahje[T]<-new 一 table 
9 size[T]<2 .sizefT] 
10 insetrt x into tablerT] 
11 um [Taum [THi 


请 注意 , 这 里 有 两 种 “* 揪 人 * 过 程 :TABLE-INSERT 过 程 本 身 与 第 6 行 和 第 10 行 中 的 基 
本 捅 入 。 可 以 根据 基本 揪 和 人 的 操作 数 来 分 析 TABLE-INSERT 的 运行 时 间 , 每 个 基本 妊 人 井 
作 的 代价 为 1 假定 TABLE-INSERT 的 实际 运行 时 间 与 因 项 的 时 间 成 线性 关系 ,使 司 在 
第 2 行 中 分 配 初 始 表 的 开销 为 常数 ,而 第 5 行 与 第 7 行 中 分 本 和 释放 存储 的 开销 由 第 6 行 中 
转 称 表 中 所 有 项 的 开销 决定 。 我 们 称 第 5$-9 行 中 执行 then 语句 的 事件 为 一 次 扩张 ， 

更 在 我 们 来 分 析 一 于 作 用 诈 一 个 初始 为 空 的 表 上 的 mm 次 TABLE-INSERT 操 攻 的 地 
列 . 第 i 次 操作 的 代价 c 怎样 ? 如 果 在 当前 的 表 中 还 有 空间 (或 该 操作 是 第 一 个 操作 )， 则 
si=1， 因 为 这 时 我 们 只 需 在 第 10 行 中 执行 一 次 基本 插入 操作 即 可 。 如 果 当 前 的 表 是 注 的 ， 
则 发 生 一 次 扩张 ， 这 时 cG=i 第 10 行 中 基本 插 人 换 作 的 代价 1 再 加 上 第 6 行 中 将 原 表 中 的 
项 复制 到 新 表 中 的 代价 王 1。、 如 果 执 行 了 na 次 操作 ， 风 一 次 操作 的 最 坏 情 况 代 前 为 Dinj， 册 
此 可 得 次 操作 的 总 的 运行 时 间 的 上 界 On )。 

得 这 个 界 不 很 紧 确 ， 因 为 在 执行 na 次 TABLE-FNSERT 操作 的 过 程 中 并 不 常常 包括 扩 
张 表 的 代价 。 特 别 地 ， 仅 当 记 1 为 2 的 整数 者 时 第 ji 次 操作 才 会 引起 一 次 才 的 扩张 实际 
上 上， 每 一 次 操作 的 平 排 代价 为 DO， 将 “ 司 我 们 可 以 用 育 集 方法 加 以 证 明 。 第 i 次 操作 的 代 

价 为 


-总 Un 和 to 


。 -ff 如 果 i 一 1 为 2 的 一 个 整数 等 
i 1 否则 
由 此 ，n 次 TABLE 一 INSERT 操 作 的 总 代价 为 
下 上 nj ， 
2c 和 n+ 了 2 
必 生 十 2n 
一 3 


因为 至 多 有 次 操作 的 代价 为 1， 而 余下 的 操作 的 代价 就 构成 了 一 个 几何 级 数 。 因 为 nn 次， 
TABLE-INSERT 操作 的 总 代价 为 3n， 故 每 一 操作 的 平 摊 代 价 为 3。 
通过 采用 会 计 方 法 ， 我 们 可 以 对 为 什么 一 次 TABLE-INSERT 操作 的 平 捧 代 价 会 是 3 
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有 一 些 认 识 。 从 直觉 上 看 ， 每 一 项 要 支付 三 次 基本 插 人 提 作 : 将 其 自身 插 人 现行 表 中 ， 当 表 
扩张 时 其 自身 的 移动 ， 以 及 对 另 一 个 在 扩张 表 时 已 经 移动 过 的 另 一 项 的 移动 。 例 如 ， 假 设 刚 
刚 完 成 扩张 后 某 一 表 的 大 小 为 mm， 那么 表 中 共有 my72 项 ， 且 没有 “存款 "。 对 每 一 次 插入 探 
作 要 收费 3 元。 立即 发 生 的 基本 揪 人 的 代价 为 1 元 ， 另 有 工 元 放 在 刚 揪 人 的 元 素 上 作为 存 
款 ， 余 下 的 1 元 放 在 马 在 表 中 的 四 /72 个 质 上 的 某 -一 信和 必 为 存款 。 填 满 该 表 另 需要 myv2 个 
项 上 的 某 一 个 作为 存款 。 填 满 该 表 另 需要 mm /2 次 插 人 ， 这 样 ， 到 该 表 包 含 了 m 个 项 (已 满 ) 
时 ， 每 --- 项 都 有 ] 元 钱 以 支付 在 表 扩 张 期 闯 的 揪 人 。 
也 可 以 用 势能 方法 来 分 析 一 系列 拉 个 TABLE-TINSERT 操作 ， 我 们 还 将 在 18.4.2 节 中 
用 此 方法 来 设计 一 个 平 摊 代 价 为 D 的 TABLE-DELETE 的 操作 。 开 始 时 我 们 先 定 多 一 个 
势 函 数 而 ， 在 完成 扩张 时 它 为 小 当 表 满 时 它 也 达到 责 的 大 小 、 这样 下 -次 扩张 的 代价 就 可 
由 存储 的 势 来 支付 了 了。 函数 
小 (人 =2 .numE 了 一 sizeT] 《18.4) 
是 一 种 可 能 的 选择 。 存 刚 则 完成 一 次 扩张 后 ， 我 们 有 numf[ 训 =sizel[Tiy 2， 于 是 有 
GT)=0， 这 让 是 所 希望 的 . 在 就 要 做 一 次 扩张 前 ， 有 umiT] =size[T， 于 是 
ET)= numiT， 这 也 正 基 我 们 希望 的 。 势 的 初 值 为 0， 又 因为 表 总 是 至 少 为 半 斌 num[T] 
>sizefT] / 2， 这 就 意味 着 f(T) 总 是 非 负 的 。 所 以 ，n 次 TABLE-INSERT 操作 的 总 的 平 排 
代价 就 是 总 的 实际 代价 的 一 个 上 界 . 


为 了 分 析 第 i 次 TABLE - INSERT 操作 的 平 排 代价 ， 我 们 用 num 来 表示 在 第 次 操作 
后 表 中 所 存放 的 项 数 ，size, 表示 在 第 i 次 操作 之 后 表 的 大 小 ，@, 才 示 第 [次 操作 之 后 的 
势 。 开 始 时 .有 num = 小，size =0 和 外 ,一 1 

如 果 第 i 次 TABLE -- INSERT 操作 没有 能 触发 一 次 表 扩 张 ， 则 size; = size，,， 且 该 


操作 的 平反 代价 为 
Ci 一 Ci 十 生 一 由 
二 1 十 (2 mumi 一 Size) 一 人 2 num， ,一 Size 1) 
= 十 人 hum, 一 size) 一 (2(numi 一切 一 sizei) 
一 3 


如 果 第 i 次 操作 确实 触发 了 一 次 扩张 4 则 size = size，, = num, 一 1、 且 该 操作 的 平 排 
代价 为 
C 一 怠 十 粳 ii 一 他 一 1 


一 num ;十 人 2. num; 一 Size) 一 (2 .num ,一 Size |) 
= htm 二 (2 humi 一 人- numi 一 芒 一 (20numi 一 JJ 一 (numi 一 于 
= 一 num 十 2 一 (pum, 一 1 
-3 
图 18.3 画 出 了 num ，size， 和 惠 ; 的 各 个 值 。 在 第 ; 次 操作 后 对 这 些 量 中 的 每 一 个 都 要 


“ 吉 以 计算 。 图 中 出 线 表示 numi， 粗 线 表 示 sizei， 虚线 表示 中 ， 注 意 在 每 一 次 扩张 前 ， 势 


一 2 一 


已 增长 到 等 于 表 中 的 项 目 数 ， 了 内 而 可 以 支付 将 所 有 元 素 移 到 新 表 中 去 的 代价 。 此 后 ， 势 降 
为 由 但 一 但 引起 扩张 的 项 目 被 揪 人 时 其 信 就 立即 增加 2 


量 
到 
更 
团 
加 
呈 
团 
加 


Cs 





园 18.3 对 表 中 项 目 数 naumi， 表 中 的 空位 数 size， 以 及 势 中 一 2 .numi 一 siz6i 
作用 hn 从 TABLE-TNSERT 操 作 的 效果 


18.4.2” 训 扩 张 和 收 缩 


为 了 实现 TABLE-~DELETE 操作 ， 只 要 将 指定 的 项 从 表 中 去 掉 即 可 。 但 是 ， 当 某 …- 表 
的 装载 因子 过 小 时 ， 我 们 就 希望 对 表 进 行 收 缩 ， 使 得 浪费 的 空间 不 致 大 大 。 表 收缩 与 表 扩 张 
是 类 似 的 : 当 表 中 的 项 数 笑 得 过 低 时 ， 我 们 就 要 分 配 一 个 新 的 、 更 小 的 表 ， 而 后 将 则 表 的 各 
项 复制 到 新 表 中 。 旧 表 所 占用 的 存储 空间 则 可 被 释放 、 归 还 到 存储 管理 系统 中 去 。 在 理想 情 
况 王 ， 我 们 希望 下 面 两 个 性 质 成 立 : 

- 动态 表 的 装 载 因子 由 一 常数 下 方 限界 ， 且 

各 表 操 作 的 平 摊 代 价 册 一 常数 下 方 限 界 。 

另外 ， 我 们 假设 用 基本 揪 人 和 删除 操作 来 测度 代价 。 

关于 表 收 编 和 扩张 的 一 -个 自然 的 策略 是 当 向 表 中 揪 人 一 个 项 时 将 表 的 规模 扩大 一 倍 ， 而 
当 从 表 中 岸 除 一 项 就 导致 表 的 状态 小 于 半 满 时 ， 则 将 表 缩 小 一 半 。 这 个 策略 保证 了 表 的 装载 
因子 始终 不 会 低 于 1 7 2， 但 不 幸 的 是 ， 这 样 又 会 导致 各 表 操 作 具 有 较 大 的 平 摊 代 价 。 请 考 
虚 一 下 下 面 这 种 情况 : 我 们 对 某 一 表 工 扫 行 na 了 殉 操作 ， 此 处 n 为 2 的 整数 矫 。 前 ny2 个 操 
作 是 插 人 .由 前 面 的 分 折 可 知 其 总 伐 价 为 Qtm， 在 这 一 系列 插 人 操作 的 结束 处 . 
DumfT]= size[ 和 =ny7 2， 对 所 而 的 7 2 个 操作 ， 我 们 搜 行 上 面 这 样 -: 个 却 瑰 : 

工 刀 ,也 工 工 瑟 ,并 ……， 

其 中 工夫 示 插 人 ， 呈 表示 删除 。 第 一 次 揪 人 导致 玫 扩 张 至 规模 9。 紧 拨 的 两 次 删除 又 将 表 的 
大 夏收 缩 至 n72; 紧 接 的 两 次 揪 人 又 导致 形 的 另 一 次 扩张 ， 等 等 。 每 次 扩张 和 收缩 的 代价 
为 @tm)， 共 有 外 (次 扩张 或 收缩， 这样，n 次 操作 的 总 代价 为 昌 (n 涩 ， 而 每 一 次 操作 的 平 
据 代 价 为 加 (n). 


一 24] 一 


这 种 策 栈 的 困难 性 是 玛丽 易 见 的 : 在 一 次 扩张 之 后 ， 我 们 设 有 人 笨 足够 的 删除 来 支付 一 次 
收缩 的 代价 。 类 似 地 ， 在 一 次 收缩 后 ， 我 们 也 役 有 向 是 够 的 揪 人 以 支付 一 次 扩张 的 代价 。 
我 们 可 以 对 这 个 策略 加 以 改进 , 即 允 许 装 载 网 子 低 于 T7 2。 具 体 来 说 , 当 向 满 的 表 中 揪 
和 人 -项 时 , 还 是 将 表 扩 大 一 傍 , 但 当 删 除 一 项 而 引起 表 不 是 174 满 时 ,我 们 就 将 表 缩 小 为 原 
来 的 一 半 。 这 样 . 表 的 装 因 子 就 由 常数 17 4 十 方 限界 。 这 种 合法 揭 基 本 思想 是 使 扩张 以 
后 表 的 装载 因子 为 7 2。 因 而, 在 发 生 一 次 收缩 前 可 删除 表 中 一 半 的 项 , 因为 只 有 当 装 载 因 
闻 低 二 174 时 方 会 发 和 和 收 缩 。 周 埋 , 在 收缩 之 后 . 表 的 装载 因子 也 是 17 2。 这样, 在 发 生 扩 
张萌 刺 通 过 扩张 将 表 中 的 项 数 描 加 一 售 , 因为 只要 当 表 的 吾 载 因子 超过 1 时 方 能 发 生 扩 张 。 
我 们 略 去 了 TABLE-DELETE 的 代码 ， 因 为 它 与 TABLE-1INSERT 的 代码 是 娄 似 
的 。 为 了 方便 分 析 ， 我 们 假定 如 果 表 中 的 项 数 降 笠 0， 就 释放 该 元 所 占 存 储 空 间 。 亦 即 ， 如 
果 num[fT]=0，、 凤 size[T] -= 0. 
现在 我 们 用 势能 六 法 来 分 析 由 习 个 TABLE-INSERT 和 TABLE--PELETE 操作 梅 成 
药 序列 的 代价 。 无 定义 一 个 势 丽 名 中 它 在 刚 完 成 一 次 扩张 或 收缩 时 值 为 0， 并 随 着 装载 因 
子 增 皇上 或 降 芭 17 布 变化 。 我 们 用 xiT=num[T sizef] 来 表示 一 个 非 空 表 了 T 的 装 栽 因 
子 。 对 … 个 非 空 南 ， 因 为 有 nannfT -= size[TI -0，、， 目 x0T) = 一 1， 履 总 有 numf 于 一 xD 
size[T]， 无 论 该 表 是 否 为 空 ， 我 们 采用 的 势 盖 娄 为 
onD= 千 ”num[T 一 Sizef 昔 cfT 芝 172 
size1T] “2 一 aumfTj 基 wxTI<172 
请 计 意 , 空 表 的 势 为 侧 势 总 是 非 负 的 。 这 样 ， 以 甲 表示 的 一 列 换 帮 的 总 平反 代价 即 为 
持 实 际 代价 的 一 个 上 界 
在 进行 详细 分 本 之 前 ， 我 们 先 来 看 看 势 上 数 的 基 些 性 质 ，。， 当 装载 因子 为 17 2 针 ， 势 为 
0。 当 它 为 时 ， 在 szelT]= numfTI，、 这 就 意味 着 和 (=numfT， 这 样 当 因 播 人 一 项 而 引 
起 -- 次 扩张 时 ， 就 可 用 势 来 支付 其 代价 。 当 装载 回 子 为 174 针 ， 我 们 有 size[T]=4. 
nuam[T]， 它 意味 着 员 ( 站 =nunfTI， 因 而 当 删 除 基 个 项 引 超 一 次 收缩 时 就 可 用 势 来 壹 付 其 代 
价 ， 图 18.4 说 明了 对 一 系列 拘 作 过 是 如 何 变化 风 。 
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酌 18.4 对 表 中 的 项 目 数 nurmi、 表 中 的 空位 数 sizei 此 执 


《18.5) 





下 5% 


2 .numi 一 size， 车 wx 2172 

人 /72 一 numn， 痪 xc <172 
作用 nn 个 TABLE 一 INSERT 和 TABLE 一 DELETE 棵 作 的 效果 。 细 线 示 出 了 num ， 炎 
线 示 出 了 size ,， 虐 线 示 出 了 瑟 , 。 注 春 在 一 次 扩张 前 ， 势 增加 到 等 于 表 中 的 项 目 数 ， 故 它 能 


支付 将 所 有 元 素 移 到 新 表 中 去 的 代价 。 类 似 地 ， 在 一 次 收缩 之 前 ， 势 也 增加 到 等 于 避 中 的 
项 目 数 。 
为 分 析 m 个 TABLE 一 INSERT 和 TABLE 一 DELETE 的 操作 序列 ， 我 们 用 c 来 表示 


第 i 次 操作 的 实际 代价 ，c, 表示 其 参照 下 的 平 排 代价 ，num, 表示 在 第 i 次 操作 之 后 表 中 存 

储 的 项 数 ，size; 表示 第 i 次 操作 后 表 的 大 小 ，x,; 表示 第 i 次 操作 后 表 的 装载 因子 ， 中 表示 

第 i 次 操作 后 的 势 . 开始 时 ，pnum = 0，size, =0，w 一 1， 电 ， = 0. 
我 们 从 第 i 次 操作 是 TABLE -INSERT 的 情况 开始 分 析 。 如 果 wx _， 关 1/2， 则 所 要 


做 的 分 析 就 与 18.4.1 中 对 表 扩 张 的 分 析 完全 一 样 。 无 论 表 是 否 进 行 了 扩张 ， 该 操作 的 平 排 
.代价 i 都 至 多 是 3， 如 果 w ,< 17 2， 则 表 不 会 因 该 操作 而 扩张 ， 因 为 仅 当 w _，= 1 时 才 


发 生 扩 张 。 如 果 还 有 xx < 17 2， 岗 第 ii 个 操作 的 平 摊 代 价 为 
c， 一 i 十 由， 一 企 ， 


一 1 


一 
一 1+(Sizei 2 一 Humi) 一 人 size /2 一 pum ) 
一 1 二 (sizei 7 2 一 numi) 一 (sizel 7 2 一 人 num 一] 
一 候 
如 果 x, ,< LI72， 但 x, z172， 那 径 
C， = 一 e| 十 下 | 一 由 


1 一 ] 
一 工 十 他 num, 一 Size) 一 一 zei-72 一 ?Un 


4 一 1 
= 一 1+ (2(pum， 十] 一 Size ) 一 (size， /2 一 hum ，) 


3 . 
一 3 "num ， 一 Sizei_， 十 3 
. 3 
一 3xi_ Size， ， 一 方 Sizei_l 十 3 
< jsize ,一 size 十 3 


= 一 3 
因此 ， 一 次 TABLE-INSERT 操作 的 平 排 代价 至 多 为 3。 
现在 我 们 再 来 分 析 一 下 第 个 操作 是 TABLE-DELETE 的 情形 。 这 时 ， 
num = nu 一。 如 果 w_ <172， 外] 半 要 二 虑 次 操作 是 百 会 引起 一 次 收缩 。 如 果 没 有 ， 
则 sizei = Sizei 1， 而 该 染 作 的 平 摊 代 价 则 为 
C| 一 5 加 


一 1+(sizei7 2 一 numi) 一 (size 7Z2 一 num |) 
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一 1 十 Gize 7 一 numn) 一 (size， “2~ (numi 十 ] 
一 乡 
如 果 w <172 且 第 i 个 操作 没有 触发 一 次 收缩 。 则 该 操作 的 实际 代价 为 5 一 nuUD， 
， 因 为 我 们 删除 了 一 项 ， 移 动 了 nuim, 项 . 这 时 ， sjze , /2 一 size，, /4 一 mum +1， 而 
人 的 平 搜 代 从 - ， 
| 一 上 十 吾 | 一 中 ， 
= (num， 十 了 + (sizel 7 2 一 num) 一 (size /2 一 num， ) 
= (num, 十 切 二 (oum +1) 一 num ) 一 ((2 . num 十 分 一 (num + 1)) 
一 】 
当 第 i 次 操作 为 TABLE~-DELRETE 目 ww_ ,zl172 2 时， - 苇 平 捧 代 价 仍 由 一 常数 从 上 方 限 
失 。 有 关 这 种 情况 的 分 析 留 作 练 习 18.4 一 3。 


总 之 ， 因 为 每 个 操作 的 平 排 代价 都 月 一 常数 上 界 ， 所 以 作用 于 一 动态 表 上 的 个 操作 
的 实际 时 间 为 Oo) 


思考 题 . 


18-1 按 位 反 序 二 进 计 数 器 


第 三 十 二 章 要 讨论 一 种 重要 的 算法 ， 称 作 快 速 富里 叶 变 换 ， 或 FFT。FFST 算法 的 第 
一 步 执行 一 次 对 长 度 为 a= 2xGk 为 全 个 非 负 台 数 ) 的 输入 数组 AI0..o-1] 的 按 位 反 序 排列 。 这 
种 排列 将 某 些 元 素 进行 交换 ， 这 些 元 素 的 下 标的 一 进 表示 正好 相反 。 


我 们 人 &a 表示 成 一 个 K 位 的 序列 <a ia，…，ao>， 技 中 a 
= 了 ,ai2 。 另 定义 ， 
Tev 风 < 了 -82 一 ai 
根据 这 个 定义 有 ，_， 
rev ca 一 过 ak- 12 


人 例如， 如果 na= 16( 或 等 价 地 ，kK=4， 则 rev (3) 二 12， 因为 数值 3 的 4 位 表示 为 0011， 
将 其 道 反 就 得 1100， 即 12 的 4 位 表示 。 

4. 结 定 一 个 运行 时 间 为 @@(k) 的 郑 数 revl 请 写 出 一 个 能 在 Onk) 时 间 内 完成 对 一 个 长 
度 为 翼 = 笠 的 数组 的 按 位 反 序 排 玛 的 算法 : 

我 们 可 以 用 一 个 基于 平 纵 分 析 的 算法 来 改善 按 位 反 序 排 列 的 运行 时 间 ， 方法 是 采用 一 个 
“ 按 位 反 序 计数 器 ?和 -- 个 过 程 IT-~-REVERSED-IJINCREMENT， 该 过 程 在 给 定 一 个 按 位 
反 序 计数 器 的 值 < 后， 给 出 revk(revtfa)+D。 例 如 ， 如 果 k=4， 且 计数 器 的 初始 值 为 0， 则 
连续 调用 BIT-~REVERSED-INCREMENT 就 产生 序列 

0000,1000.0100.1100.G0010.1010,… 一 0.8,.4,12.2,.10,… 
b. 假设 计算 机 中 的 一 个 子 可 以 存储 k 位 的 值 ， 且 机 器 可 以 在 单位 时 间 内 究 成 对 这 些 二 
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进 值 的 诸如 向 左 或 右 称 任意 位 ， 按 位 与 、 按 位 或 等 操作 .请 给 出 过 程 
BIT-REVERSED-INCREMENT 的 一 个 实现 ， 使 之 能 在 On) 时 间 内 完成 对 一 个 售 m 个 元 
素 的 按 位 反 序 排列 ， 

C. 候 设 可 以 在 单位 时 间 内 对 一 个 计算 机 字 左 秒 或 者 移 一 位 ， 这 时 是 否 仍 可 能 实现 - ~ 个 
Dm 时 间 的 按 位 反 序 排列 ? 


18-2 ” 司 二 叉 查 找 动态 化 


对 一 个 已 排序 数组 的 二 叉 查 找 要 花 对 数 的 时 间 ， 而 揪 人 一 个 新 元 素 的 时 间 则 与 数组 的 大 
小 成 线性 关系 。 通 过 保持 个 已 排序 的 数组 ， 我 们 可 以 将 插入 的 时 间 加 以 改善 ， 

具体 来 说 ， 假 设 我 们 希望 在 一 个 包含 a 个 元 索 的 集合 上 支持 SEARCH 和 INSERT 操 
作 .。 设 x= 『lg(o+1D)] ， 且 mn 的 二 进 表 示 为 <nt_unkt_ >…vno>。 我 们 有 k 个 排序 的 数组 
AAA 其 中 对 ji 站 tb “ 汪 ， 数组 Ai 的 长 度 为 2。 每 个 数组 或 者 是 满 的 ， 或 者 是 


空 的 ， 这 取决 于 mi= 1 述 是 mi=(. 个 数组 中 共有 元 素 工 - 和 一周 虽然 每 个 数组 者 是 已 


jj 


排序 的 ， 伍 属 于 不 同 的 数组 中 的 元 素 之 间 却 没有 什么 特别 的 关系 。 

a. 请 描述 如 何在 这 种 数据 结构 上 做 SEARCH 操作 ， 并 分 析 其 最 坏 情况 运行 时 间 . 

tb. 请 说 明 如 何 向 这 种 数据 结构 中 捅 入 一个 新 元 素 ， 并 分 析 插 人 操作 的 最 坏 情 况 和 平 排 
的 运行 时 间 。. 

5. 讨论 如 何 实现 DELETE.。 


18-3 弟 捧 权 平 衡 树 


假设 在 一 栋 普 通 的 二 又 查找 树 中 ， 对 每 个 节点 X 增 吉 一 个 域 size[x]， 它 指示 在 以 ; x 为 根 
的 子 树 中 关键 字 的 个 数 。 设 g 是 在 范围 17 2 和 xc< 工 之 问 的 一 个 常数 . 我 们 说 某 一 给 定 的 节 
点 多 是 wx 平衡 的 ， 如 果 

sizefleft[x]] 六 空 ，size[x] 
且 
size[ripght[xjj 和 wx -sizeix] 

如 果树 中 每 个 节点 都 是 vx 一 平衡 的 ， 则 整 棵 树 惰 是 wx 平衡 的 。 下 面 的 维护 权 平 衡 树 的 平 
” 捧 方 法 是 由 台 .Varghese 提出 的 ， 

a. 从 某 种 程度 上 来 说 ， 一 标 17 2- 平 衡 的 树 已 达到 了 最 大 可 能 的 平衡 程度 . 给 定 任意 一 
棵 二 久 查 找 树 中 的 某 个 节点 x， 请 说 明 如 何 重建 以 x 为 根 的 子 树 使 之 为 1 7 2-- 平 衡 ， 所 给 出 
的 的 算法 的 运行 时 间 应 为 包 (sizeixjj)， 且 可 以 利用 DGsize[xj) 的 辅助 存储 空间 。 

b. 证 明 : 对 一 标 有 mn 个 节点 、o- 平 衡 的 二 叉 树 做 一 次 查找 在 最 坏 情况 下 要 花 OUlg 站 时 
疗 。 

假设 & 严格 大 于 1 / 2。 另 假设 INSERT 和 DELETE 如 在 通常 的 一 叉 查 找 树 上 一 禅 实 
玛 ， 只 是 在 每 次 操作 之 后 ， 如 果树 中 有 任何 节点 不 再 是 呈 平 衡 的 了 ， 则 重建 以 树 中 最 高 的 
这 样 的 顶点 为 根 的 子 树 ， 使 之 成 为 17 2 平衡 。 

我 们 来 用 势能 方法 对 这 种 重建 方案 进行 分 析 。 对 二 叉 查 找 树 工 中 的 一 个 节点 x 定义 

Ar(x) 一 [size[left[x]-size[right[x 阳 ， 4 
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再 定义 工 的 势 为 
dy=c > 09 | 


ET ua 名 了 


其 中 e 是 个 依赖 于 x 的 足够 大 的 常数 ， 

c. 论证 : "任何 二 又 查找 树 都 具有 非 负 的 势 ;_ 棵 1 7 2_ 平 衡 树 的 势 为 0。 

d. 假设 可 用 mm 单位 的 势 来 支付 重建 一 樟 包 含 mm 个 节点 的 子 树 。 若 要 在 O(D) 平 排 时 间 内 
重建 一 标 非 呈 平 衡 的 子 树 ， 则 以 以 “ 表示 ) 应 为 多 天? 

e. 证 明 : 对 一 棵 包含 na 个 节点 的 叶 平 衡 树 ， 揪 入 一 个 节点 或 副 除 一 个 节点 需要 Dllg D) 
平 捧 时 间 。 


练习 十 八 


18.I|-1 如 果 一 组 栈 操作 中 包括 了 一 次 MULTIPOP 操作 ， 那 么 栈 操作 的 平 排 代价 的 界 O(T) 是 否 还 能 
保持 ? 

18.1-2 证 明 : 在 芋 位 计数 器 的 情 子 中 ， 如 果 和 包括 了 一 个 DECREMENT 操作 ， 则 nm 次 操作 的 找 价 为 
作 (nk)， . 、… 
18.1-3 现 对 某 数据 结构 执行 一 列 n 个 操作 .如 果 ji 为 2 的 整数 署 的话 ， 风 第 i 次 操作 的 代价 为 i， 否 
则 为 1， 请 利用 诊 集 方法 来 分 析 确定 每 次 操作 的 代价 。 


18.2-1 现 对 一 个 大 小 始终 不 超过 上 的 栈 执 行 一 系列 的 枢 捅 作 。 在 每 上 个 操作 后 ， 复 制 整个 栈 的 内 容 
以 依 作 后 备 。 环 明 : 在 对 每 种 栈 操作 黑 了 予 合适 的 平 排 代价 后 ，n 个 栈 操作 (包括 复制 栈 的 操作 ) 的 代价 为 
Cn)。 

18.2-2 利用 会 计 方 法 重 艇 练习 18.1-3, 

18.2-3 ”假设 我 们 希望 不 仅 能 司 一 个 计数 毕 增 值 ， 也 能 使 之 复位 为 零 (即使 其 中 所 有 位 都 为 0。 请 说 三 
如 何 将 一 个 计数 实 静 为 一 个 位 向 量 ， 使 得 对 一 个 初始 为 0 的 计数 散 ， 妊 一 包 舍 m 个 IJNCREMENT 和 
RESRT 操作 的 序列 的 时 间 为 DGn)。 (提示 : 用 一 个 指针 指向 高 位 U 


18.3-1 休 没 有 势 函 数 阵 ， 使 得 @D)zEDoJ， 但 GDoF0. 证 明 : 存在 一 个 势 函 数 下 使 得 
人 (Do =0， 和 Di) 关 0，i 关 1， 且 用 生 表 示 的 平反 代价 与 用 全 表示 的 平 捧 代 价 是 相同 的 ， 

18.3-2 用 势能 方法 重 做 练习 18.1-3， 

18.3-3 考虑 一 个 包含 个 元 素 的 普通 一 叉 堆 数据 结构 ， 它 支持 最 坏 情况 时 间 代价 为 OUg 名 的 操作 
INSERT 和 EXTRACT-MIN。 请 给 出 一 个 势 函 数 @，INSERT 的 平 排 代价 为 .OUsg m， EXTRACT-MIN 
的 平 排 代 价 为 O(1)， 并 证 册 该 函 教 确 实 是 有 用 的 。 

18.3-4 ”假设 某 个 要 在 执行 na 个 牧 操作 PUSH,， POP 和 MULTIPOP 之 前 包含 so 个 元 素 ， 结束 后 乌 全 
su 个 元 素 ， 风 这 硅 个 栈 操 作 的 总 代价 是 多 少 ? 

18.3-5， 候 说 一 个 计数 器 在 开始 时 有 b 个 1， 而 不 是 0。 证明 : 如 果 ， 了 一 人 (bb 的 话 执 行 习 次 TNCRE- 
MENT 操作 的 时 间 代 价 为 Dim,. 《不 能 假设 b 是 个 常数 )。 

t8.3-6 说 明 如 何 用 两 个 普通 的 栈 来 实现 一 个 队列 { 尹 习 11.4- 句 ， 使 得 每 个 ENQUEUE 和 
DEQUEUE 操作 的 平 排 代 价 都 为 QTD)。 


18.4-1 论 王 : 如 果 m stiy2 且 ms172， 则 一 次 TABLE-INSERT 操作 的 平 排 代 价 为 0。 
18.4-2 假设 我 们 希 记 实现 一 个 动态 开放 地 址 杂 详 表 ， 当 表 的 装载 因子 达到 某 个 严格 小 于 1 的 信 x 
时 ， 就 可 以 认为 表 渍 了 ， 这 是 为 什么 ? 请 简洁 地 说 明 如 何 对 一 个 动态 的 开放 地 址 杂 关 表 进行 糙 人 和信， 使 得 每 
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个 插 人 操作 的 平 排 找 价 的 期 鹿 信 为 D0D)。 为 什么 每 个 搬 人 操作 的 实际 代价 的 期望值 不 必 是 D0D? 
18.4-3 证 明 : 如 果 作 用 于 一 动态 表 上 的 第 1 个 操作 是 TABLE-DELETE， 且 w-iz172。 则 以 势 函 
数 (18. 约 表示 的 每 个 操作 的 平 排 代价 由 一 常数 从 上 方 限界 . ， 
18.4-4 ” 候 设 当 某 个 表 的 装载 因子 降 至 174 以 下 时 ， 我 们 不 是 通过 将 其 大 小 缩小 -- 半 来 进行 收缩 ; 在 
表 的 装载 因子 低 于 173 时 ， 通 过 将 其 规模 薪 上 27 3 来 进行 收缩。 利用 势 函 教 
了 TD 一 |2 hum[fTl~size[T] . 
来 证 明 采 用 这 种 策略 的 TABLE-DELETE 操作 的 衬 排 代价 由 一 常数 从 上 方 限界 。 
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第 五 篇 “高 级 数据 结构 


这 一 部 分 再 重新 讨论 支持 动态 集合 上 的 操作 的 数据 结构 ， 但 是 是 在 比 第 三 篇 葛 高 级 的 程 
度 上 进行 的 。 例 如 ， 其 中 有 两 章 大 量 地 用 到 了 我 们 在 第 十 八 章 中 介绍 过 的 平 排 分 析 技术 。 

第 十 九 章 将 介绍 B- 树 ， 这 是 一 种 设计 成 存储 于 磁盘 上 的 平衡 二 叉 查 找 树 。 因 为 磁 欠 的 
操作 速度 要 大 大 慢 于 随机 存 了 到 存 储 器 ， 所 以 我 们 在 分 析 B- 树 的 性 能 时 ， 不 仅 要 看 动态 集合 
操作 花 了 多 少 计算 时 间 ， 还 要 看 执行 了 多 少 次 磁盘 存 取 操 作 。 对 每 一 种 B-- 树 操作 ， 补 盘存 
取 药 次 数 随 B~ 树 的 高 度 而 增加 ， 而 各 操作 又 能 保持 B- 树 具有 较 低 的 高 度 。 

第 二 十 章 和 二 十 一 章 给 出 了 可 合并 堆 的 几 种 实现 。 这 种 堆 支 持 操 作 INSERT，MINTL 
MUM，EXTRACT-MIN 和 UNION。 操作 UNION 用 于 合并 两 个 堆 。 这 两 章 中 出 现 的 
数据 结构 还 支持 DELETE 和 DECREASE--KEY 操作 。 

第 二 十 章 中 出 现 的 二 项 堆 结 构 能 在 Of( 志 中 的 最 坏 情况 时 间 司 内 支持 以 上 各 种 操作 ， 此 处 
n 为 输入 堆 中 总 元 素数 (在 UNION 时 为 两 个 输入 堆 中 的 总 的 元 素数 )， 实 际 上 ， 就 是 在 支持 
UNION 操作 方面 二 项 堆 才 显然 比 第 七 章 中 介绍 的 二 又 堆 优越 的 ， 因为 在 最 坏 情况 下 合并 两 
个 二 尺 堆 要 花 Go) 的 时 间 。 

第 二 十 一 章 中 将 要 介绍 的 斐 波 那 契 堆 又 对 二 项 堆 作 了 改进 ， 至 少 从 理论 上 说 是 这 样 的 . 
我 们 将 用 平 捧 时 间 界 来 测度 翡 波 那 韶 堆 的 性 能 。 对 这 种 堆 ， 操 作 INSERT，MINIMUM 和 
UNION 仅 花 O(D 的 实际 和 平反 时 间 ， 而 操作 EXTRACT-MIHN 和 DELETE 要 花 D(lg 
的 平 捧 时 间 。 斐 波 那 契 堆 的 最 重要 的 优点 在 于 DECREASE- 孜 EY 仅 花 DID 的 平 捧 时 间 。 
该 操作 具有 这 样 低 的 平 排 时 间 是 辈 波 那 契 堆 是 到 目前 为 止 图 论 问 题 中 某 些 渐 近 上 最 快 的 算法 

， 第 二 十 二 章 要 介绍 用 于 分 离 集合 的 一 些 数据 结构 ， 由 了 个 元 兹 构成 的 域 被 划分 

成 基于 动 志 统 全 开始 时 ， 每 个 元 素 属于 由 其 自身 所 构成 的 单元 集合 。 操作 UNION 将 两 
个 集合 加 以 合并 ， 而 查询 FIND-SET 则 可 确定 给 定 的 元 素 当 前 所 属 的 那个 集合 。 通 过 用 一 
棵 简单 的 有 根 树 来 表示 每 个 集合 ， 我 们 可 以 得 到 令 人 吃惊 的 快速 的 操作 : 一 个 由 mm 个 操作 
构成 的 序列 的 运行 时 间 为 Dtmatmn,n))， 此 处 wma) 是 一 个 增长 得 极 慢 的 函数 -一 只 要 nm 不 大 
于 整个 已 知 的 域 中 预计 的 原子 数 ，z(ma) 就 至 多 为 4。 这 个 问题 中 的 数据 结构 是 简单 的 ， 但 
用 来 证 明 这 个 对 间 界 的 平 排 分 析 却 出 较 复杂 。 第 二 十 二 章 证 明了 关于 运行 时 间 的 一 个 有 趣 而 
更 简单 的 界 。 
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第 十 九 音 ”B- 树 


了 一 树 是 一 种 平衡 查找 树 ， 它 在 磁盘 或 其 他 直接 存 取 辅 存 设 备 上 具有 较 好 的 性 能 ，B- 树 
与 第 十 四 章 中 介绍 的 红 -~- 黑 树 类 似 ， 但 在 降低 盘 I7 O 操作 次 数 方面 更 好 一 些 。 ，， 

B- 树 与 红 - 冉 大 的 主要 不 同 在 于 芭 - 树 的 节点 可 以 有 许多 子女 ， 从 几 个 到 几 千 个 . 这 就 
是 说 ，B- 树 的 “分 支 因子 "可 以 很 大 ， 但 它 常 常 是 由 所 使 用 的 琢 单 元 的 特性 决定 的 。B~ 树 与 
红 一 黑 树 的 相似 之 处 在 于 每 棵 含 n 个 节点 的 B- 树 的 高 度 为 O(lgn)， 但 可 能 要 比 一 标 红 - 眉 
树 的 高 度 小 许多 ， 因 为 它 的 分 支 内 子 较 大 。 所 以 ，B-- 树 也 能 在 O(lgn)j 时 间 内 实现 许多 动 
态 集 合 操作 .。 

B- 树 以 很 自 然 的 方式 推广 了 一 叉 查 找 树 ， 图 19.1 示 出 了 一 棵 简单 的 B- 树 。 如 果 B- 树 
的 某 节 点 xx 包含 nfx] 个 关键 字 , 周 x 就 有 [xjHHl 个 子女 。 节 点 x 中 的 关键 字 是 用 来 将 x 所 处 
理 的 关键 字 划 分 成 ntxl+l 个 子 域 的 分 割 点 ， 这 些 子 域 中 的 每 一 个 都 由 x 的 一 个 子女 来 处 
理 。 当 要 在 一 棵 B- 树 中 查找 某 关键 字 时 * 通过 对 存储 在 节点 关中 的 nfx] 个 关键 字 的 比较 而 
微 出 一 个 (an[xj+H) 路 决定 ,一 个 牢 含 nx] 个 关键 字 药 内 节点 x 有 nixl+1l 个 子女 。 所 有 的 时 
节点 都 处 于 树 中 相同 的 深度 。 加 了 浅 阴 影 的 节点 为 在 查找 字母 求 中 所 槛 检查 的 节点 。 





图 19.1 ”一 株 其 关键 宇 为 英语 中 办 音字 母 的 B- 树 


19.1 节 将 给 出 B_ 树 的 精确 定义 ， 并 证 明 B-_ 树 的 高 度 随 它 所 包 售 的 节点 数 而 对 数 式 地 
增长 。19.2 节 介绍 了 如 何在 了 - 树 中 查找 或 搬 人 一 个 关键 字 ，19.3 节 讨论 了 删除 操作 。 在 开 
巡 下 面 内 容 之 前 ， 先 来 看 看 针对 磁盘 而 设计 的 数据 结构 与 针对 随机 存 取 的 主 存 而 设计 的 数据 
结 梅 的 不 同 . 站 | 

辅 存 上 的 数据 结构 

有 许多 不 同 的 技术 可 用 来 在 计 竺 机 系统 中 提供 存储 容重 。 主 存 一 般 是 由 硅 制 的 存储 芯片 
组 成 ， 每 个 芯片 可 存放 100 万 位 数据 。 这 种 技术 的 每 一 位 代价 要 比 磁 存储 技术 《如 磁带 或 巩 
盘 ) 要 高 ， 轴 存 的 容量 通常 比 主 存 容量 要 大 好 几 个 数量 级 . 


图 19.2 示 出 了 一 个 典型 的 磁盘 驱动 器 。 盘 表 面 覆盖 了 一 层 可 磁化 的 物质 。 读 / 与 头 可 ， 
从 旋转 着 的 磁 盘 表 面 上 读 或 写 数据 . 读 / 写 臂 可 将 读 写 头 定位 在 臣 离 盘 中 心 的 不 同 的 位 置 
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处 。 当 读 / 写 头 静止 时 ， 由 它 底下 经 过 的 盘 表 面 称 为 一 个 磁道 。 存 储 在 每 个 磁道 上 的 信息 通 
常常 划分 成 固定 数量 的 〈 大 小 相同 的 ) 页 ; 在 一 个 典 再 的 盘 中 ， 每 一 页 的 长 度 为 2048 字 
节 。 信 息 存 储 或 检索 的 基本 单位 为 一 页 ， 亦 即 磁 盘 读 写 操作 都 是 针对 完整 的 页 进行 的 存 取 
时 间 (定位 读 / 写 头 并 等 待 特定 的 一 页 信息 经 过 读 / 写 头 的 时 间 》 可 能 会 较 大 (例如 ，20 
毫秒 ) ， 而 一 旦 定位 了 以 后 ， 谈 或 写 一 页 的 时 间 却 是 较 小 的 。 磁 盘存 储 技术 在 代价 较 低 的 同 
时 也 存在 着 存 取 数 据 的 时 间 相 对 较 长 的 特点 。 因 为 移动 电子 要 比 移动 大 的 物体 容易 得 多 ， 所 
以 完全 电子 的 存储 设备 (如 硅 存 储 芯 片 ) 的 存 取 时 间 就 要 比 包含 移动 部 件 的 设备 〈 如 磁盘 驱 
动 器 ) 的 存 取 时 间 少 得 多 。 但 是 ， 一 旦 正 狂 地 定 了 位 后 ， 对 磁盘 的 读 或 写 也 是 完全 电子 化 的 
(除了 胡 的 旋转 而 外 )， 对 大 量 数据 有 读 或 写 也 可 很 决 地 完成 。 





图 19.2 一 个 典型 的 磁盘 驱动 器 


通常 来 说 ， 存 取 一 页 信息 并 将 其 从 磁盘 中 转 册 的 时 间 要 比 计算 机 对 所 读 出 的 数据 进行 检 
查 的 时 间 要 多 。 由 于 这 个 原因 ， 在 这 一 章 里 我 们 对 运行 时 间 的 两 个 主要 组 成 部 分 分 别 加 以 考 
“ 虑 : 

- 盘存 取 的 次 数 
. CPU (计算 ) 时 间 

上 存 取 的 次 数 是 按 需要 从 盘 中 读 出 或 向 盘 中 写 人 的 信息 的 责 数 米 测 度 的 ， 磁 檀 的 存 取 时 
间 不 是 常数 ， 它 与 当前 磁道 与 所 需 定位 磁道 以 及 磁盘 的 初始 旋转 状态 有 关 ， 但 我 们 将 用 读 或 
写 的 页 数 来 作为 存 到 视盘 的 总 时 间 的 大 致 的 一 阶 近似 ， 

在 一 个 典型 的 B-- 树 应 用 中 ， 要 处 理 的 数据 量 非 常 大 ， 无 法 一 次 都 装 人 主 存 ，B- 树 短 法 
将 所 需 的 页 选择 出 来 复制 到 主 存 中 去 ， 而 后 将 修改 过 的 页 再 写 回 到 磁盘 上 去 。 因 为 B- 树 算 
法 在 任何 时 刻 在 主 存 中 只 需 一 定量 的 页 数 ， 故 主 存 的 大 小 并 不 会 跟 制 可 被 处 理 的 B- 树 的 大 
小 。 

下 面 的 伪 代 码 中 给 出 了 各 种 磁盘 操作 的 模式 。 设 x 为 指向 某 一 对 象 的 指针 。 如 果 该 对 象 
当前 在 计算 机 的 主 存 中 。 则 我 们 可 以 如 通常 一 样 地 引用 该 对 象 的 各 个 域 : key[x]， 等 等 。 但 
是 ， 如 果 x 指向 的 对 象 存在 于 盘 上 ， 则 在 引用 该 对 象 的 各 个 域 之 前 要 先 执行 操作 
DISK- READ(x) 将 其 读 到 主 存 中 来 。 (我 们 假定 如 果 x 已 经 在 主 存 中 ， 则 
DISK- READGx) 就 无 需 任 何 盘存 取 , 即 它 是 一 个 空 操 作 .) 类 似 地 ， 操 作 
DISK-WRITE(x) 用 来 保存 对 对 象 x 的 域 所 做 的 修改 。 下 面 是 对 对 象 进行 操作 的 典型 模 


x<- 扫 问 某 个 对 象 的 指针 

DISK-READMx) 

访问 冲 娘 朴 x 的 域 的 操作 

DISK-WRITE) 全 如 果 没 有 修改 x 的 域 则 订 省 略 这 一 步 
其 他 访问 世 不 修改 x 城 的 操作 


个 ， 呈 站 Ts 


了 


在 任何 时 刻 ， 这 个 系统 只 能 在 主 存 中 维持 有 限 的 页 数 。 我 们 将 假定 不 再 有 用 的 页 将 由 聚 
统 从 主 存 中 换 出 , 我 们 的 B-- 树 算法 将 忽 赂 这 一 点 ， 

因为 在 大 多 数 的 系统 中 一 个 B- 树 算法 的 运行 时 间 主 要 由 它 所 执行 的 DISK- 有 READ 和 
DR 操作 的 次 数 所 决定 ， 故 可 坎 集中 使 用 这 了 丙 种 操作 来 读 或 写 臣 可 能 多 的 信息 . 

， 一 个 B-- 树 的 节点 的 大 小 通常 相当 于 整个 一 磁 琢 页， 而 一 个 B- 树 节点 的 子女 数 就 头 

庆 由 厂 盘 页 的 大 小 所 决定 . 

对 存在 磁 栖 上 的 一 标 大 的 了 -~- 树 ， 通 常 好 用 的 分 支 因 子 为 50 到 2000， 具体 要 取决 一 个 
甘 键 字 相 对 于 -- 页 的 大 小 。 选 取 一 个 大 的 分 支 因 子 可 大 大 地 降低 树 的 高 度 以 及 寻找 任意 关键 
字 时 所 需 的 磁盘 存 取 次 数 。 图 19.3. 示 出 了 一 标 高 度 为 2 分 支 因 子 为 1001 的 B- 树 ，、 每 个 内 
节点 及 时 节点 包含 1000 个 关键 字 。 在 深度 1 上 共有 1001 个 节点 ， 在 深度 为 2 处 有 元 于 100 
万 个 的 时 节点 。 未 于 每 个 节点 内 的 为 wx， 即 x 中 的 关键 字 个 数 ， 因 为 根 节 点 可 始终 置 于 主 
存 中 ， 故 在 这 棵 树 中 寻找 某 一 关键 字 至 多 只 需 一 -次 存 取 ， 


roow[7] 





图 193 “一个 高 度 为 2 的 B_ 树 包含 多 于 10 亿 个 关键 字 


19.1  B-- 树 的 和 窟 闵 


为 简单 起 见 ， 我 们 仍 定 ， 像 我 们 在 二 允 树 查找 树 和 红 - 黑 树 中 一 样 ， 与 某 一 关键 字 相 联 
系 的 “卫星 数据 "与 该 关键 字 存 故 在 一 起 。 在 实践 中 ， 我 们 在 每 个 关键 字 处 证 能 只 是 存放 了 一 
个 指 癌 包含 该 关键 字 的 “卫星 数据 "的 另 一 个 磁盘 真 的 指针 。 这 一 章 的 伪 代 玛 中 , 都 路 售 地 假 
定 了 无 论 是 与 关键 字 相 联系 的 卫星 数据 还 是 指向 这 样 的 数据 的 指针 , 都 与 关键 字 一 起 移动 ， 
在 吨 一 种 常用 的 B- 树 的 组 织 方式 中 ,所 有 的 卫星 数据 都 存 于 叶 节 点 中 ， 只 将 关 刍 字 和 子女 
指针 存 于 内 节点 里 ， 这 样 也 就 最 大 化 了 内 节点 的 分 支 因子 。 

”一 棵 8- 树 工 是 具有 如 下 性 质 的 有 根 树 ( 根 为 ropotiT]): 
1. 每 个 节点 x 有 以 下 这 些 域 : 
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a.mnix]， 当 前 存储 在 节点 xz 中 的 关键 字数 ; 
b. n[x]l 个 关键 字 ， 以 非 降 次 序 存 放 : keyi[] 委 key:[x 芝 所 keypqd; 
cleaf[xj， 是 一 个 布尔 值 ， 如 果 x 为 叶子 时 它 为 TRUE， 否 出 为 FALSEE。 
. 如 果 x 为 一 内 节点 ， 它 还 包含 n[xhH1 个 指向 其 子女 的 指针 cj[xl,cfxl]，…，camtt。 叶 
节点 没有 子女 ， 故 它们 的 6 域 无 定义 。 
3. 各 关键 字 keyi[Dq] 对 存储 在 各 子 树 中 的 关键 字 域 加 以 划分 : 如 果 区 为 存储 在 以 cl[g 为 根 
的 子 树 中 的 关键 字 ， 风 
ki 委 Jeyi[ 国 和 甩 J 委 Keyz[ 丽 系 … 所 keyag[ 加 乏 kpha 
4. 每 个 时 节点 具有 相同 的 深度 ， 即 树 的 高 度 h。 
5. 每 一 节点 能 包含 的 关键 字数 有 着 下 界 和 上 界 。 这 些 界 可 由 一 称 为 B- 树 的 最 小 度数 的 
整数 + 关 2 来 表示 
a， 每 个 非 根 的 节点 至少 应 有 t_1 个 关 链 字 ， 每 个 非 根 的 办 节点 至 少 有 t 个 子女 。 如 
果 权 是 非 空 的 ， 风 根 节点 至 少 包含 一 个 关键 字 ; 
b. 每 个 节点 可 包 售 至 多 2t-1 个 关键 字 。 所 以 ， 一 个 肉 节 点 至 卿 可 有 2t 个 子女 。 我 
们 说 一 个 节点 是 满 的 ， 如 果 它 恰 包 依 2t 一 1 个 关键 字 。 
t=2 时 的 3- 树 是 最 简单 的 ， 其 中 每 个 内 节点 有 2 个 、3 个 或 4 个 子女 ， 亦 即 一 棵 
2-3 一 树 。 在 实践 中 ， 一 般 都 要 采用 大 得 多 的 t+ 值 。 


B- 树 的 高 度 


B-- 树 上 大 部 分 操作 氛 需 的 磁盘 存 取 次 数 与 B- 树 的 高 度 是 成 正比 的 。 下面 我 们 来 分 析 
B-- 树 的 最 坏 情况 高 度 . 
定理 好 .1 ”如果 nzl， 则 对 任意 一 覃 包含 个 关键 字 的 、 高 度 为 h 的 、 最 小 度数 t 关 2 
的 B- 树 T， 
hh 专 log ~ 


kw 





+1 
2 
证 明 : 如 果 一 棵 B- 树 的 度 为 号 ， 当 其 根 节点 包 全 一 个 关键 字 而 其 他 节点 包含 t 太 1 个 
关键 字 时 ， 树 中 包含 的 节点 数 最 少 。 在 这 种 情况 中 ， 有 2 个 节点 深度 为 1，2t 个 节点 深度 为 
2，2f 个 节点 深度 为 3， 等 等 ， 直 至 深度 h 处 共有 2f ”个 节点 .图 19.4 示 出 了 h= 3 时 的 一 
棵 树 。 这 样 ， 关 键 宁 个 数 n 满足 不 等 式 
nm 之 1 十 仁 一 革 Ze 





=1+2(4 一 1) (5 一 ) 


=2 一 1 
定理 得 证 。 

这 里 我 们 可 以 看 出 ， 与 红 - 黑 树 相 比 ，B- 树 的 高 度 都 以 D(lg nm) 的 速度 增长 《请 注意 
是 个 常数 )， 对 B-~ 树 来 说 对 数 的 底 要 大 很 多 倍 。 对 大 多 数 操作 来 说 要 查找 的 节点 数 在 B- 树 
中 林 比 在 红 - 黑 树 中 少 一 个 ]t 的 因子 。 因 为 在 树 中 查找 任意 一 个 节点 通常 需要 一 次 盘存 
取 ， 帮 盘存 取 的 次 数 大 大 地 减少 。 
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图 19.4 一 棵 高 旗 为 3 的 B- 树 所 可 能 包 售 的 量 少 关键 字数 
19.2  B- 树 上 的 基本 操作 


这 一 节 里 ， 我 们 要 给 出 操作 B- TREE- SEARCH，B-TREE- CREATE 和 
B-TREE-INSERT 的 细节 。 在 这 些 过 程 中 ， 我 们 采用 了 两 个 约定 : 
. B- 树 的 根 节点 始终 在 主 存 中 ， 因 而 无 需 对 根 做 DISK--READ; 但 是 ， 每 当 根 节点 被 
改变 后 ， 要 对 根 节点 做 一 次 DISK 一 WRITE， 
- 任何 被 当 作 参数 的 节点 被 传递 之 前 ， 要 先 对 它们 做 一 次 PDISK-READ.。 
我 们 要 介绍 的 各 过 程 都 是 “一 遍 ? 算 法 ， 它 们 沿 根 下 降 ， 没 有 任何 回潮 。 


查找 了 B-- 树 


查找 3- 树 与 查找 二 又 查找 树 很 相似 ， 但 是 在 等 一 个 入 点 所 做 的 不 是 个 二 叉 的 《或 “两 
路 ") 分 支 快 定 ， 而 是 根据 该 节点 的 子女 数 所 做 出 的 多 路 分 支 决 定 ， 更 准确 地 说 ， 在 每 个 内 
节点 x， 我 们 要 做 (na[x]+l) 的 分 支 岂 定 。 

B-TREE-SEARCH 是 对 定义 在 二 又 查找 树 上 的 TREE-SEARCH 过 程 的 简单 直接 的 
推广 ， 其 输入 是 一 个 指向 某 子 树 的 根 节点 x 的 指针 以 及 要 在 该 子 树 中 查找 的 一 个 关键 字 k。 
顶层 调用 的 形式 为 B- TREE- SEARCH(root[T ，k 。 如 果 下 在 B-- 树 中 ， 
HB-TREE-SEARCH 就 返回 一 个 由 节点 yY 和 使 keyi[y] 成 立 的 下 标 i 组 成 的 序 对 (y， 芭 。 否 
则 ， 返 回 值 NIL. 


B--TREE-SEARCHIx， 茹 
Le 一 
while is nm and >keyi[z] 

do ji- 二 1 
证 nx and K=keyi[x] 

then return 人， 了 
让 把 ij 

then _ return 了 MI 

.else DISK-READIciD) 

TetUID ES 呈 ARCHKG[x 


的 全 
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通过 采用 一 个 线性 查找 过 程 ， 第 1-3 行 找 出 使 上 所 keyifx] 成 立 的 最 小 的 i， 或 将 置 为 
njfx]+1。 第 4 一 5 行 检查 是 朱 已 找到 所 需 的 关键 字 ， 如 果 找 到 了 ， 则 返回 。 第 6-9 行 或 者 不 成 
功 地 结束 查找 《如 果 x 是 个 时节 点 )， 或 者 在 执行 了 必须 的 DIS 下 -READ 后 递归 查找 x 的 
子 树 . 

图 19.1 中 说 明了 B-TREE-SEARCH 的 操作 过 程 ; 加 阴影 的 节点 是 在 查找 关键 字 及 
的 过 程 中 要 检查 的 那些 节点 。 

像 在 作用 于 二 又 查找 树 的 TREE-SEARCH 过 程 中 那样 ， 在 递归 过 程 中 所 遇 到 的 节点 
构成 了 一 条 则 桦 根 证 降 的 路 径 。 由 BTREE-SEARCH 所 存 了 到 的 盐 责 数 为 @@ 由 ) 
= @flogn)， 此 处 h 为 树 的 高 度 ，mn 为 树 中 所 含 的 关键 字 个 数 。 因 为 n[ 台 <2t， 故 第 2 一 3 行 
中 在 每 个 节点 处 的 while 循环 的 时 间 为 DO， 总 的 CPU 时 间 为 Ofth) =Oldogn)。 


创建 一 棵 空 了 ~- 树 


为 构造 一 棵 B- 树 本 ， 我 们 先 用 B~TREE-CREATE 来 创建 一 个 空 的 根 节 点 ， 和 再 调用 

下- TREE-- INSERT 以 加 人 新 的 关键 字 ， 这 两 个 过 程 都 要 用 到 一 个 输 助 过 程 
ALLOCATE-NODE， 它 在 DID 时 间 内 为 一 个 新 节点 分 配 一 个 磁盘 页 。 我 们 可 以 恤 定 由 
ALLOCATE-NOPE 所 创建 的 节点 无 需 做 DISK 一 READ， 因 为 太 盘 上 还 没有 关于 该 节点 
的 有 用 的 信息 . 

B-TREE~-CREATE(T) 

] xx LEOCATE-NODODEI》 

2 leai[x]--TRUE 

3 _ mx 

呈 了 D 玖 茂 一 是 飞 TTEIX) 

全 TOetET] 一 -区 


这 个 过 程 需 要 OH 次 的 盘 操 作 和 QOGD 的 CPU 时 间 。 
B- 树 中 节点 的 分 发 


向 妊 - 树 中 播 人 一 个 关键 字 要 比 向 二 双 查 找 树 中 插 人 一 个 关键 字 复 杂 得 多 。 搬 人 过 程 中 
要 用 到 的 一 个 基本 操作 是 将 一 个 满 的 节点 yY 〈 有 2t-1 个 关键 字 ) 按 其 中 间 关 键 字 keyy] 分 
裂 成 两 个 各 含 导 1 个 关键 字 的 节点 。 同 时 中 间 关 键 字 被 提升 到 y 的 父 节 点 中 一 它 在 y 分 列 
之 前 必须 是 非 满 的 一 以 标识 两 标 新 的 树 的 划分 点 ; 如 果 y 没 有 父 节点 ， 则 树 的 高 凑 就 增加 
1。 所 以 ， 分 裂 是 树 长 高 的 一 种 途径 。 

过 程 B-TREE-SPLIT-CHILD 的 输入 为 一 非 满 内 节点 x 【假定 在 主 存 中 )， 王 标 x， 
以 及 一 个 满足 y=eb] 为 x 的 满 子 节 点 的 y。 该 过 程 将 这 个 孩子 分 型 为 两 个 ， 并 调整 x 使 之 
有 有 -一 个 新 增 的 孩子 。 

图 19.5 说 明了 这 个 过 程 。 满 节点 y 按 其 中 间 关 键 字 $ 进行 分 裂 ， 分 裂 为 两 个 节点 y 和 
z。y 的 中 全 关键 字 S 被 提升 到 y 的 父 节 点 之 中 。y 中 大 于 中 间 关 键 字 的 那些 关 链 字 都 鸽 于 一 


个 新 节点 z 之 中 ， 它 成 为 x 的 一 个 新 孩子 , 
B-TREE-SPLIT-CHILDC，i， 人 7 
1 ze 一 ALLOCATE-NODEI ) 
2 leatfzl<…ieaffyj 


3 证 zt 一 ] 
4 foer 六 1 to 鳃 1 
5 do key[zj-xeyriy] 
6 证 Pot lcaffy 
了 then for 认 L tp 全 
必 do cz es 
2 yj - 族 1 
1 for js-ntxHi downto 计 } 
1 do “cr 二 ci 
12 cix-z 
1 for jnx dowa to 1; 
14 de keyhzjekeyi[x] 
1 key 一 keyy] 
16 mnfx]<-nf[xl+1l 
17 疡 1 区 一 WRITE 
1]4 DIS 长 一 WRITE 
扫 改 1 大 一 WRITE 


B-TREE-SPLIT~-CHILD 是 以 简单 的 “剪贴 "方式 工作 的 。 这 里 y 了 是 工 的 第 ii 个 孩子 ， 
也 是 要 被 分 裂 的 节点 。 开 始 时 节点 yY 有 2t-1 个 子女 ， 在 分 询 后 碱 少 至 t1 个 子女 。 节 点 
“收养 "了 Yy 的 tr-1 个 最 大 的 子女 ， 并 成 为 的 一 个 新 的 孩子 ， 它 在 x 的 子女 表 中 人 奴 位 于 y 之 
后 。y 的 中 隔 关 键 字 上 升 到 xx 中 ， 成 为 分 割 7 和 =z 的 关键 字 . 

第 1--8 行 峰 建 节 点 z， 并 将 y 的 二 1 个 最 大 的 关 铀 字 以 及 相应 的 1 个 子女 给 它 。 第 9 行 
调整 y 的 关键 字 计 教 。 最 后 ， 第 10-16 行 将 z 禁 人 为 xx 的 孩子 ， 并 调整 x 的 关键 字 计 数 。 
第 17-19 行将 所 有 入 改过 的 磁盘 页 写 出 。B-TREE-SPLIT-CHILD 占用 CPU 时 间 为 
@ 人 ， 这 主要 是 由 于 第 4-5 行 和 7~8 行 中 的 循环 引起 的 (其 他 的 循环 至 多 执行 七 次 )。 





站 嫉 . 及 为 7 
图 19.5 对 t+t=4 的 一 个 节点 进行 分 列 
向 B- 树 中 揪 入 一 关键 字 


向 一 棵 高 度 为 的 B- 树 下 中 搬 人 一 个 关键 字 冯 的 操作 是 在 沿 树 下 降 的 过 程 中 一 次 完成 
的 , 共和 需要 CO 次 盘存 取 操 作 , 所 需 的 CPU 时 间 为 Dtt 由 =Otogm)。 过 程 B-TREE-IN- 
SERT 利用 B-TREE-~SPLIT-CHILD 来 保证 递归 始终 不 会 降 至 一 个 满 节 点 上 。 
HB- TREE--INSERTICT，K) 


1 re rootfT 
2 证 =2t 一 ) 


一 265 一 


3 tben s< 汪 ALLOCATE--NODEI ) 

舌 rootfT]<-s 

leafls]<-FEAI.SE 

契 njs]= 0 

7 Ci[sT= 一 

8 B-TREE-SPLIT-CHILDIs，、1，D) 

全 了 一 工 RE 一 INSERT-NONEULIELLsS，) 
心 


1 else B 一 TREE-INSERT-NONFULLI， 巧 


第 3-9 行 处 理 了 根 节点 r 为 满 的 情况 : 对 根 进 行 分 型 ， 一 新 节点 s( 有 两 个 子女 ) 成 为 
根 。 新 根 包 含 了 工 的 中 间 关 键 字 ， 并 以 工 的 两 半 作 为 其 子女 。 当 根 被 分 裂 时 ，B- 树 的 高 度 
增加 了 1。 图 19.6 说 明了 这 种 情况 ， 与 二 叉 查 找 树 不 同 ，B-- 树 的 高 度 增加 是 在 顶部 而 不 是 
在 底部 发 生 的 。 上 上述 过 程 在 结束 时 调用 B-TREE-~-INSERT-NONEULL 来 将 关键 字 羡 持 
人 到 以 该 非 氏 的 要 节点 为 根 的 树 中 。B-TREE-INSERT-NONEULL 在 需要 时 沿 树 递 最 下 
降 ， 在 任何 时 刻 都 出 于 它 在 必要 时 调用 了 B-TREE-SPLIT-CHILD 而 保证 了 它 所 递归 处 
理 的 节点 是 非 满 的 . 

辅助 递归 的 过 程 B-TREE-INSERT-NONFULL 将 关键 字 k 插入 节点 x 《我 们 假定 在 
调用 该 过 程 时 x 是 非 满 的 )。B-TREE-INSERT 的 操作 过 程 和 HBH- TREE~ INSERT 一 
NONEULL 的 递归 操作 过 程 保证 了 我 们 的 假设 是 正确 的 。 
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图 19.6 对 t=14 的 要 进行 分 裂 


B-TREE-INSERT-NONEFULLx， 扣 ) 
1 ie-n[x] 

2 证 leaffx] 

3 then While jiz1 and k<keyiD] 


do ke i[x]< keyilx] 
ii 一 

6 Key 

了 nm[xjnixj+1i 

咏 DIS 其 一 WRITELXJ 

9 glise while ii 闻 1 and 萎 < Keyixj 
10 do 证 一 

11 ie _i+1 

12 _DISK-READ(c[) 

13 证 hfebdJ= 2t 一 1 

14 then B-TREE-SPLIT-CHILD(x、i，c[x]) 
15 证 在 > keyi[x] 


16 thben ie 证 1 
]17 B-TREE-TNSEFRT-NONEULLIc[x，X) 


这 个 过 程 是 这 样 工作 的 : 第 3--8 行 处 理 了 x 是 时 子 的 情况 ， 即 将 关键 字 K 揪 人 x。 如 果 
x 不 是 个 时节 点 ， 应 将 捅 人 到 以 内 节点 x 为 根 的 的 子 树 中 适当 的 叶 节 点 中 去 。 在 这 种 情况 
中 ， 第 9-11 行 确定 向 x 的 哪个 子 节点 递归 下 降 。 第 13 行 检查 递 妇 是 否 要 降 至 一 个 满 节点 
上 ， 若 是 , 则 在 第 14 行 中 用 B-TREE--SPLIT-CHILD 将 该 子 节点 分 列 成 两 个 非 满 的 子 节 
点 ， 第 15-16 行 确定 再 进一步 向 哪 一 个 节点 下 降 〈 请 注意 在 第 16 行 中 增加 i 后 和 无 需 再 做 一 
次 DISK- READ(c[ 双 》， 末 8 为 在 这 种 情况 下 递归 要 降 至 一 个 刚刚 由 
B-TREE-SPLIT-CHILD 创建 的 子 节点 上 )。 这 样 ， 第 13-16 行 的 实际 效果 就 是 保证 了 该 
过 程 始终 不 会 降 至 一 个 满 节点 上 。 第 17 行道 归 地 将 播 人 到 合适 的 子 树 中 去 。 图 19.7 示 出 
了 将 关键 字 插 人 一 标 B 一 树 中 的 不 同情 形 。 
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图 19.7 ”向 3- 和 树 中 揪 和 人 关键 字 


这 棵 B- 树 的 最 小 度数 为 3， 屋 一 个 节点 至 多 可 包含 5 个 关键 字 。 由 揪 人 过 程 作 了 修改 
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的 节点 都 可 了 浅 阴 形 。 (al) 这 个 例子 中 初始 的 侍 。(b) 将 关键 字 B 插 人 初始 树 后 的 结果 ,这 
基 一 个 对 叶 节 点 的 简单 的 捕 人 。{e) 将 关键 字 Q 揪 人 前 一 棵 树 中 的 结果 .节点 RSTUV 被 ， 
分 裂 成 两 个 各 包 合 RS 和 UV 的 节点 ， 关 键 字 了 被 提升 到 根 中 ， 所 被 搬 人 到 及 S 节点 中 。 
(d) 将 E 插入 到 前 一 棵 和 树 中 的 结果 。 根 节点 立即 被 分 旬 ， 因 为 它 是 满 的 ; 园 针 B- 树 的 商 度 
增加 了 1。L 被 插 人 到 包含 下 的 叶 节 点 中 。 (el 将 播 信 到 前 一 棵 树 中 的 结果 。 在 将 下 捅 
人 到 最 右 一 半 《〈DE 节点 ) 之 前 节操 和 ABCPDE 要 进行 分 发 。 

对 一 棵 高 度 为 h 的 B- 树 ，B-TREE--INSERT 要 和 做 的 盘存 取 次 数 为 DIh)， 因 为 在 两 次 
调用 B-TREE-INSERT- NONEFULL 之 间 仅 做 的 DID 次 DISK- READ 和 
DISK-WRITE 操作 。 所 占用 的 总 的 CPU 时 间 为 Otthb) = Oftlogin)。 因 为 B--TREE-IN- 
SERT-NONEFULL 是 尾 递归 的 ， 故 它 也 可 用 一 个 whilie 循环 来 实现 ， 证 明了 任何 时 刀 需 要 
在 主人 存 中 的 页 数 为 OIL1) 。 


19.3 从 BRB- 树 中 删除 一 个 关键 字 


B-- 树 上 的 删除 操作 与 插 和 人 操作 类 似 ， 只 是 更 沉 杂 些 。 下 面 我 们 大 致 地 措 述 -- 下 其 工作 
过 程 〈 这 上 儿 就 不 给 出 其 完整 的 伪 代 码 了 )， 
假定 用 过 程 B-TREE-DELETE 来 从 以 x 为 根 的 子 树 中 删除 关键 字 k。 这 个 过 程 的 结 
构 保 证 了 无 论 在 何 时 对 节点 工 递 妇 调 上 朋 B-TREE-DELETE，x 中 的 关键 字数 都 又 少 等 于 最 
小 度数 t。 注 意 这 个 条 件 蔓 求 比 通常 的 B- 树 中 最 少 的 关键 字数 多 1 个 的 基 键 字 ， 使 得 在 当 
递归 降 奋 基 节 点 的 一 个 子 节 点 上 时 ， 可 将 该 节点 称 到 那个 子 节 点 中 去 。 这 个 如 强 的 条 件 允 许 
我 们 在 一 趟 下 降 过 程 中 就 可 将 一 个 关键 字 从 树 中 删除 ， 甩 无 需 任何 回 谢 《只 有 一 个 例外 情 
况 ， 后 面 我们 将 解释 )。 下 面 对 B- 树 上 删除 操作 各 步 晴 的 规定 应 当 这 样 来 理解 ， 如 果 根 季 
点 x 会 成 为 一 个 不 含 任何 关键 字 的 内 节点 ， 则 x 就 要 被 删除 ， 而 x 的 仅 有 的 孩子 cl[q] 就 成 
为 树 的 新 根 ， 从 而 将 衬 的 高 度 降 低 了 !， 针 时 也 保持 站 树 根 必须 包含 至 少 一 个 关键 字 (除非 
树 是 空 的 ) 的 性 质 。 
图 19.8 示 出 了 从 B~ 树 中 删除 关键 字 的 各 种 情况 。 图 中 B-- 树 的 最 小 度数 为 t= 3, 故 每 一 
个 节点 《路 了 根 节点 ) 所 包含 的 关键 字 不 能 少 千 > 个 。 帘 修改 了 的 节点 都 加 了 浅 阴 影 。 (a) 
图 19.?7(e) 中 的 B- 树 ，(b) 删除 F。 这 对 庶 于 情况 1: 对 一 个 叶 节点 中 关键 字 的 简单 山 
除 。(c) 删除 M。 这 对 应 于 情况 2a: M 的 前 驱 被 提升 以 取代 M 的 位 置 . (qd) 删除 G. 
这 对 应 于 情况 2c: 避 下 降 以 构成 节点 DEGJK， 然 后 得 将 怠 从 这 个 叶 节 点 中 删除 (和 情况 
D。(e) 删除 呈 。 这 对 并 情 况 3b， 递 归 不 能 降 圣 节点 CL， 因 为 它 仅 有 二 个 关键 字 、 故 了 
下 峰 并 与 CL 和 TX 合并 以 构成 CLPTX; 然后 ， 将 D 从 一 个 时节 点 中 册 除 〈 情 况 1) 。 
te 了 在 (d) 之 后 ， 根 节点 被 删 路 ， 树 的 责 度 缩减 了 1。 人 删除 B。 这 对 应 于 情况 3a: 
移动 C 以 填补 B 的 位 置 ， 移 动 世 以 填补 C 的 位 置 。 
1. 如 果 关 键 字 k 在 节点 x 中 ， 且 工 是 个 叶 节 点 ， 册 从 x 中 删除 k- 
2. 如 果 基 键 字 下 在 节点 x 申 且 x 是 个 内 节点 ， 则 稚 如 下 操作 : 
a， 如 果 节 点 x 中 前 于 k 的 子 节点 y 包 全 至 少 t 个 关键 字 ， 则 找 出 kx 在 以 y 为 根 的 子 树 中 
的 前 驱 K。 递 归 地 删除 k'， 并 在 x 中 用 kK 取 代 K。 (找到 并 除 可 在 沿 树 下 距 
的 -- 趟 过 程 中 完成 。) 
-一 8 一 


b. 对 称 地 ， 如 果 节 点 x 中 位 于 k 之 后 的 子 节点 z 和 包含 至 少 t 个 关键 字 ， 则 找 出 kx 在 以 z 
为 根 的 子 树 中 的 后 继 k'。 递 归 地 删除 K， 并 在 x 中 间 妈 取 代 东 (找到 区 并 将 之 
删除 可 以 在 一 趟 下 降 过 程 中 完成 。) 

c. 否则， 如 果 y 和 z 都 只 有 二 -1 个 关键 宇 ， 则 将 k 和 z 中 所 有 关键 字 合 并 进 y， 使 得 x 失 
捧 y 和 指向 z 的 指针 ， 这 时 y 包含 2t-!1 个 关键 字 。 然 后 ， 释 放 z 并 将 类 从 y 中 
删除 ， 

3. 如 果 关 键 字 k 不 在 内 节点 x 中 ， 则 确定 必 包 信 k 的 子 树 的 根 cf[qj 《如 果 k 确 实在 树 中 的 
话 )。 如 果 c[ 四 只 有 二 1 个 关键 字 ， 执 行 步骤 3a 或 3b 以 保证 我 们 峰 至 一 个 至 少 包含 
t 个 关键 字 的 节点 。 然 后 ， 通 过 对 x 的 某 个 子 节点 递归 而 结束 。 

a、 如 果 cf[x]j 只 包含 人 1 个 关键 字 ， 但 它 的 一 个 兄弟 包含 t 个 关键 则 通过 将 x 中 的 某 一 
关键 字 降 至 clx] 中 ， 将 [四 的 仅 左 或 仅 右 兄弟 中 的 某 一 关键 字 升 至 x 将 该 兄弟 
中 的 某 个 关键 字 移 到 c[x] 中 而 使 [xj 中 增加 一 个 关键 字 . 

b. 如 果 c[x] 以 及 c[q 的 所 有 兄弟 包含 计 1 个 关键 宇 ， 则 将 5 与 一 个 咒 弟 合并 ， 即 将 x 
的 一 个 关键 字 移 至 新 合并 的 节点 ， 使 之 成 为 该 节点 的 中 间 关 键 字 。 
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图 19.8 从 B~ 树 中 删除 节点 
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因为 一 棵 B- 树 中 的 大 部 分 关键 字 都 在 叶 节 点 中 , 我 们 可 预期 在 实践 中 , 删除 操作 主要 是 
用 于 从 叶 节点 中 删除 关键 字 的 。 这 样 B-TREE-DELETE 过 程 只 要 沿 树 下 降 一 趟 即 可 , 而 无 
需 任 何 回潮 。 但 是 , 当 删 除 某 内 节点 中 的 一 个 关键 字 时 , 该 过 程 也 要 沿 树 下 降 一 趟 , 但 可 能 还 
要 返回 删除 了 关键 字 的 那个 节点 , 以 用 其 前 驱 或 后 继 来 取代 被 删除 的 关键 字 ( 情 况 2a 和 2b). 

这 个 过 程 虽然 看 似 复 杂 ， 但 对 一 棵 高 度 为 h 的 B- 树 它 只 需 D(h) 次 盘存 取 操 作 ， 因 为 
在 连续 的 调用 该 过 程 之 间 仅 需要 DOI1) 次 对 DISK--READ 和 DISK--WRITE 的 调用 。 另 
外 所 需 的 CPU 时 间 为 Dthj) =Otlogin) 。 


思 考 题 


19- 辅 存 中 的 栈 


考虑 在 一 个 有 着 相对 少量 的 快速 主 存 和 相对 大 量 的 较 慢 可 盘存 储 空间 的 计算 机 上 实现 -- 
个 栈 的 问题 。 操 作 PUSH 和 POP 的 对 象 为 单个 字 的 值 。 我 们 所 希望 支持 的 栈 可 以 增长 得 很 
大 而 无 法 装 人 主 存 ， 杂 而 它 的 大 部 分 都 要 存放 于 盘 上 。 

一 种 简单 而 低 效 的 栈 实现 方法 是 将 整个 栈 放 在 盘 上 。 在 主 存 中 保持 一 个 楼 指针 ， 它 猪 向 
栈 顶 元 素 的 盘 地 扯 。 如 果 该 指针 的 秆 为 p， 则 顶 元 素 是 盘 页 | pyml 上 的 第 (p mod in) 
个 字 。 此 处 m 为 每 页 所 含 的 字数 ， 

为 实现 PUSH 操作 , 增加 栈 指 针 ， 从 盘 中 将 适当 的 页 读 到 主 存 中 复制 要 被 压 人 该 页 上 上 适 
当 字 里 的 元 素 , 最 后 将 该 页 写 回 到 航 上 。POP 操作 的 实现 是 类 似 的 。 先 对 栈 指 针 减 值 , 从 盘 
上 读 进 所 需 的 页 , 再 返回 栈 顶 元 素 。 我 们 无 需 将 读 进 的 真 写 回 , 因为 没有 对 它 作 任何 修改 。- 

因为 盘 操 作 的 代价 相对 较 高 ， 我 们 用 总 的 盘存 取 次 数 作为 衡量 一 种 实 班 的 好 坏 的 标准 。 
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我 们 也 要 考虑 占用 的 CPU 时 间 ， 但 对 存 取 一 个 包含 m 个 字 的 页 的 代价 为 @(m)， 
a， 从 渐 近 的 意义 来 独 ， 利 用 这 种 简单 实现 的 n 个 栈 操 作 的 CPU 时 间 是 多 少 ? 〈 用 m 和 n 来 
表达 这 个 小 问题 和 后 面 几 不 小 问题 的 答案 . ) 
现在 ， 请 考 嵌 另 一 种 栈 的 实现 ， 即 我 们 始终 将 栈 的 一 页 放 在 主 存 中 。 另 有 少量 的 存储 区 
记录 在 主 存 中 时 ， 我 们 才 可 执行 一 次 栈 操 作 。 如 果 需 要 葛 话 ， 当 前 主 存 中 的 页 可 被 写 回 磁 
扒 ， 并 从 盘 上 向 主 存 中 调 人 新 的 一 页 .如 果 相 关 的 页 已 在 主 存 中 ， 则 无 需 任 何 盘存 取 ， 
b. ma 个 PUSH 操作 的 最 坏 情况 盘存 取 次 数 是 多 少 ? CPU 时 间 是 多 少 ? 
c. 个 栈 操 作 所 需 的 最 坏 情 况 盘 存 取 次 数 是 多 少 ? CPU 时 间 是 多 少 ? 
假设 又 一 种 栈 的 实现 是 保持 栈 的 两 个 真 在 主 存 中 《而 不 是 仅 用 少量 存储 来 做 短 记 工 
作 .) 
d. 请 描述 如 何 管理 栈 页 使 得 任何 栈 操作 的 平 摊 盘 存 取 次 数 为 Q(1 / m)， 平 捧 CPU 时 间 
为 O(1)。 


1-2 联结 与 分 裂 2-3 一 4 树 


联结 操作 的 输入 为 两 个 动态 集合 S” 和 S” ， 以 及 一 个 元 素 x， 使 得 对 任何 xx 《 8S/， 
x 《ES ， 我 们 有 key[x' ]<key[ 四 <keyfx7” ]。 它 返回 一 个 集合 S=S7“ LeUS”。 分 裂 
操作 有 点 像 一 个 “ 道 " 联 结 操作 : 给 定 一 个 动态 集 $ 和 一 个 元 素 xE $S， 它 创建 一 个 集合 
S”′， 其 中 包 售 了 8S 一 {fx} 中 的 所 有 关键 字 小 于 {xj 的 元 素 ; 同时 创建 了 另 一 个 集合 S” ， 其 中 
包 售 了 S-{t 中 所 有 那些 关键 字 大 于 keyfx] 的 元 烷 。 在 这 个 问题 中 ， 我 们 来 讨论 如 何在 
2-3-4 树 上 实现 这 些 操 作 。 为 方便 起 见 ， 假 定 所 有 元 素 都 只 包含 关键 字 ， 且 所 有 的 关键 字 
值 都 不 相同 . 本 
_a. 对 2-3-4 树 中 的 每 个 节点 x， 说 明 如 何 将 以 xz 为 根 的 子 树 的 高 度 作 为 一 个 域 height[x] 来 
维护 。 要 注意 所 给 出 的 实现 不 应 影响 查找 、 播 人 和 删除 操作 的 渐 近 运行 时 间 ， 
b. 说 明 如 何 实现 联结 操作 。 给 定 两 个 2-3-4 树 T ”和 T” 以 及 一 个 关键 字 k， 联 结 操作 的 
运行 对 间 应 OU -hh)， 其 中 hh 和 hy7 和 分 别 为 和 T7” 的 高 庆 。 
c. 考虑 从 一 棵 2-3--4 树 的 根 至 一 个 给 定 的 关键 字 k 的 路 径 p， 和 包含 T 中 小 于 k 的 关键 字 集 
合 S′， 以 及 包 禽 了 中 大 于 k 的 关键 字 的 入 合 S′ . 证 明 p 将 S′ 分 型 为 一 个 树 的 集 
合 {Tu”，T, ′ ，…， 下 , } 和 一 个 关键 字 的 集合 六 | ′，ks ”，…，kw ”}， 此 处 对 每 
个 ji=1，2，…，ti， 我 们 有 对 尾 何 关键 字 yE TI，zC Ti ，y< 贡 ”<z。 TI 和 T 
的 高 度 之 间 有 何 联系 ? 另 请 说 明了 是 如 何 将 S” 分裂 成 树 的 集合 和 关键 字 的 集合 的 . 
d. 请 说 明 如 何 实现 T 上 的 分 裂 操 作 。 利 用 联结 操作 将 S′ 中 的 关键 字 儿 成 一 棵 2 一 3--4 树 
T” ， 将 S$7 中 的 关键 字 拼 成 一 棵 2-3-4 树 T”。 分裂 操作 的 运行 时 间 应 为 O(leg 
ny， 此 处 为 工 中 的 关键 字 个 数 .〈 握 示 : 联结 的 代价 应 是 套 迭 的 )。 


练习 十 九 


19.1 一 ! B- 树 中 的 最 小 度数 为 什么 不 能 是 t 一 19 
19.1-2 tt 应 取 什 么 样 的 值 才能 使 图 19.1 中 的 树 是 棵 合法 的 B- 树 ? 
19.1-3 请 给 出 表示 {11，2，3，4， 引 的 最 小 度数 为 2 的 所 有 合法 B-- 树 。 
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19.1--4 ”请 导出 一 个 美 于 商 度 为 上 的 B- 树 中 可 以 厦 储 的 关键 字数 的 、 潜 示 为 最 小 度数 t 的 函数 的 紫 砚 
的 上 界 。 

19.2-!1 请 给 出 将 关键 字 F，S$， 内 ， 区 ，C， 工 ，H，T，VYV，WW，M， 有 R，N，P， 和 和， 了 ， 其 ， 阅 ， 口 ， 
Z., 王 按 序 播 人 人 一样 初 始 为 空 的 B- 树 中 的 结果 。 只 要 夯 出 在 某 些 节点 分 殊 之 前 以 及 最 后 树 的 结构 。 

19.2-2 请 解释 在 什么 情况 下 (如 果 有 的 话 )， 在 调用 8-TREE-INSERT 的 过 程 中 会 执行 元 余 的 
DISK 一 READ 或 DISK 一 WRITE 操作 。{ 一 个 宛 余 的 DISK 一 READ 是 对 已 在 主 存 中 的 某 页 人 必 
DIS 扩 -READ 元 余 的 DISK 一 多 RITE 将 已 经 存在 于 磁 失 .E 的 某 丰 又 完 全 相间 地 重 写 一 遍 。) 

19.2-3 ”请 说 明 如 簿 在 一 棵 B-- 树 中 寻找 最 小 关键 字 和 树 中 某 一 给 定 关 链 字 的 前 更 。 

19.2-4” 假设 关键 字 {1，2，…， 品 规 狂 人 一 个 最 小 虚数 为 2 的 空 B- 树 中 去 。 最终 的 B- 树 中 包 合 多 
少 个 节点 ? 

19.2-5 因为 叶 节 点 无 需 指向 子女 的 指针 ， 对 同样 大 小 的 伐 盘 下 ， 它 们 可 选用 一 个 与 府 节 点 的 不 同 的 
(更 大 的 ) 上 值 。 请 说 明 如 何 和 修改 关于 B-- 树 的 创建 和 播 人 的 过 程 以 处 理 这 种 情况 

19.2-6 根 设 B-TREE-SEARCH 是 这 样 实现 的 ， 在 每 个 节点 处 它 果 用 二 尺 查 找 ， 而 东 是 原来 的 线性 
查找 。 

证 明 : 无 论 如 何 选择 t+ 为 习 的 画 数 ]、 这 种 实现 所 和 需 的 CPU 时 间 为 OUlgnm)。 

19.2-? 人 恨 设 磁盘 硬件 允许 我 们 任意 选择 磁盘 页 的 大 小 ， 但 读 取 磁 盘 页 的 时 间 为 afbt， 其 中 a 和 bb 为 
指定 的 常数 ，( 为 采用 选 定 大 小 的 页 的 B- 树 的 最 小 上 度数。 请 揪 述 如 何 选择 + 应“〈 近 似 地 ) 最 小 化 B 一 树 的 查 
找 时 间 。 对 a&=30 毫秒 ，b= 40 微 秒 的 情形 ， 请 答 出 上 的 一 个 最 优 值 。 


19.3-1 请 说 明 按 啤 序 从 图 19.8 虽 中 删除 己 ，P，YV 后 的 结果 。 
19.3-2 请 写 出 B-TREE-DELETE 的 仿 伐 码 ， 
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第 二 十 章 一 项 堆 


本 章 和 第 二 十 一 章 要 介绍 称 为 可 合并 堆 的 数据 缚 梅 ， 它 支持 下 面 的 五 种 操作 : 
MAKE-HEAP(): 创建 并 返回 一 个 不 包 合 任何 元 素 的 新 排 。， 
INSERTUH，x): 将 节点 xX 《其 关键 字 域 已 填 人 上 内容) 插 人 堆 H。 
MINIMUMIH): 返回 一 个 指 庙 芝 中 的 包含 最 小 关键 字 的 节点 的 指针 。 
EXTRACT-MINUH): 将 再 中 包 会 最 小 关键 字 的 节点 删除 ， 并 返回 一 个 指向 该 节点 的 
指针 。 
UNIONGH,，H?): 创建 并 返回 -个 包含 堆 H 和 H, 中 所 有 节点 的 新 堆 ; 同时 ，Hi 和 
H，: 被 这 个 操作 所 破坏 。 
另外 ， 这 两 章 里 的 数据 结构 还 支持 下 面 两 种 操作 : 
DECREASE-KEY(H，x，k): 将 新 关键 字 值 〈 假 定 它 不 大 于 当前 的 其 键 字 什 ) 赋 给 
稚 理 中 的 节点 X。 
DELETE(H，x): 从 堆 开 中 删除 节点 x。 
图 20.1 中 的 表 给 岂 了 可 合 奴 的 三 种 实现 中 各 操作 的 运行 时 间 ， 在 执行 其 一 操作 时 堆 中 
的 项 目 数 用 mn 表示 。 如 表 中 所 示 ， 如 果 不 需 要 UNION 操作 ， 则 普通 的 一 叉 堆 【如 第 七 章 
的 堆 排序 中 用 到 的 ) 的 性 能 就 很 好 了 。 在 一 个 一 六 堆 上 ， 非 UNION 操作 的 最 坏 情 况 运 行 
时 间 为 Of(lg nj 《或 更 好 )。 但 是 ， 如 果 某 个 应 用 中 一 定 覃 用 到 UNION 品 作 的 话 ， 册 二 芯 
堆 就 不 能 令 人 满意 了 。UNION 操作 先 将 包含 两 个 要 合并 的 堆 的 数 并 租 ， 然 后 运行 
HEAPIFY， 其 最 址 情况 运行 时 间 为 @n)。 
在 这 一 章 里 ， 我 们 要 讨论 “二 项 堆 "*， 其 最 坏 情 况 时 间 界 如 图 20.1 中 所 示 。UNION 操 
作 只 要 QCEn) 时 间 就 可 完成 共 包 合 nm 个 元 素 的 两 个 堆 的 合并 。 
ET 
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0 
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汪 20.1 可 合并 夫 的 关 种 实现 中 和 谷 操 作 的 送行 时 间 


在 第 二 十 一 童 里 ， 我 们 将 讨论 辈 波 那 契 堆 ， 对 某 些 操作 它 其 有 更 好 的 时 间 界 。 但 请 广 
征 ， 图 20.1 中 旨 波 那 契 扒 的 运行 时 间 是 平反 时 间 胃 ， 而 不 是 每 个 操作 的 最 坏 情 况 时 间 质 。 
这 一 章 略 去 了 有 关 在 插 人 前 分 配 节点 和 删除 后 释放 市 点 的 问题 。 我们 假定 这 些 细 节 由 调 


用 堆 过 程 的 程序 来 处 理 。 

从 支持 SEARCH 操作 上 来 讲 ， 二 叉 堆 、 二 项 堆 和 斐 波 那 自 堆 都 是 低 效 的 ; 要 找到 一 个 
包含 给 定 关 键 字 的 节点 可 能 述 要 花 上 一 些 功 去 。 所 以 ， 就 因为 这 个 原因 DECREASE-KEY 
各 DELETE 等 涉及 一 个 给 定 节点 的 操作 就 需要 一 个 指向 该 节点 的 指针 以 作为 输 人 的 一 部 
分 。 对 许多 应 用 来 说 ， 这 个 要 求 不 成 任何 问题 。 

20.1 节 先 定义 二 项 树 ， 再 定义 二 项 堆 ; 努 外 ， 还 要 介绍 二 项 堆 的 一 种 特别 的 表示 。20.2 
节 说 明了 如 和 何在 图 20.1 中 给 出 的 时 间 异 内 实现 二 项 堆 上 的 操作 。 


20.1 二 项 树 与 二 项 堆 


一 个 二 项 堆 由 一 组 二 项 树 构成 ， 故 这 一 节 先 定 义 二 项 树 并 证 明 一 些 关键 性 质 ， 然 后 再 定 
义 二 项 堆 ， 并 说 明 如 何 表示 它们 ， 


吨 ，， 


b) 


号 
书 划 和 与 
千 


(c) 





20.1.1 二 项 树 


二 项 树 B, 是 一 棵 郑 归 定义 的 有 序 树 〔 兄 5.5.2 节 )， 如 转 20.2 所 示 。{a) 二 项 树 了 的 
递归 定义 ， 三 角形 瑟 示 有 根 的 子 树 。 (b) 二 项 树 Be 至 B,，B4 中 示 出 了 各 节点 的 深度 。 (e) 
以 另 寺 种 方式 来 看 二 项 树 Bk， 二 项 煤 Bo 只 包含 一 个 节点 。 二 项 树 Bu 由 两 标 二 项 树 B，, 连 
接 而 成 : + 棵 树 的 根 成 为 另 一 树 的 根 的 最 左 孩 子 。 
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下 面 的 引 理 给 出 了 二 项 树 的 一 些 性 质 。 
引 理 20.1 (二 项 树 的 性 质 ): 对 二 项 树 B, 
1. 共 有 2 个 节点 

2. 树 的 癌 庶 为 k 


3. 对 ji=0，1，..，K， 在 深度 i 处 从 有 (“) 个 节点 


4. 根 的 度数 为 ， 它 大 于 任何 其 他 节点 的 度数 ; 并 且 ， 如 果 根 的 子女 从 左 到 右 编 号 为 
k 一 1，K-2，…，0， 则 子 节点 j 为 子 树 Bi 的 根 。 

证 明 : 对 Kk 进行 归纳 。 对 每 一 个 性 质 ， 基 都 是 一 项 树 Bu。 验 证 每 个 性 质 对 Be 成 立 是 很 
容易 的 。 对 归纳 步骤 ， 我 们 假设 引 理 对 Bi 成 立 。 

1. 二 项 树 Bu 包含 两 个 Bi， 故 取 有 2 42 一 六 个 节点 。 

2. 根 据 两 个 B，, 连接 成 B, 的 方式 ， 可 知 了 节点 的 最 大 深度 比 B，, 中 的 最 大 深度 大 
1。 根 据 归 纳 假设 ， 这 个 最 大 深度 为 (k-1) +L=k， 

3. 设 D(k，iD 表示 二 项 树 Bix 在 深度 i 处 的 节点 数 。 因 为 Bt 由 两 个 Bt 连接 而 成 ， 改 
B，, 中 深度 i 处 的 某 个 节点 在 B, 中 深度 i 和 寺 1 处 各 出 现 一 次 。 换 名 话说 ，B, 中 深度 i 处 的 
节点 个 数 为 Be 中 深度 i 处 节点 个 数 与 Bt-; 中 深度 王 !1 处 节点 个 数 之 和 。 这 样 ， 

下 必 , 菩 = 了 D 纱 一 1 +TDK 一 1， ii 一] 
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第 二 个 等 式 由 归纳 假设 可 得 ， 第 三 个 假设 由 练习 6.1-7 可 得 。 

4. 在 了 中 的 度数 大 于 在 B_, 中 的 度数 的 瞧 一 节点 是 根 ， 它 在 B 中 的 子女 比 在 B，, 中 
多 一 个 。 因 为 B，, 的 根 的 度数 为 k-1， 故 了 的 根 的 度数 为 k。 根 据 归纳 假设 ， 癌 时 也 像 图 
20.2(c) 中 所 示 的 那样 ， 从 左 至 右 看 ，Bx_i 的 根 的 各 子女 分 别 为 Bt ->，Bi-3，…，Bo 的 根 。 
所 以 ， 当 将 Be_ 与 互 一 B，_; 连接 时 ， 所 得 的 根 的 子女 为 B，，B，…， 了 Bu 的 根 。 

推论 20.2 ”在 一 棵 包含 n 个 节点 的 二 项 树 中 ， 任 意 节 点 的 最 大 度数 为 lg mn。 

证 明 : 由 引 理 20.1 的 性 质 1 和 4 直接 可 得 。 


术语 “二 项 树 "是 从 引 理 20.1 的 性 质 3 而 来 的 ， 因 为 项 {。 ) 为 二 项 系数 。 练 习 20.1-3 对 
这 个 术语 作 了 进一步 的 说 明 ， 
20.1.2 ”二 项 堆 


一 项 排 日 由 -一 组 满足 上 而 徇 一 项 撕 性 奢 的 一 项 树 组 成 : 

1. 也 中 的 每 棵 二 项 糙 者 是 礁 有 皮 的 : 基 一 节点 的 甘 键 字 大 于 或 等 二 持 贫 节点 的 关 链 
宇 。 

2 在 巴 中 至 多 有 一 棵 二 项 树 的 根 具 有 给 定 的 度数 。 

第 一 个 性 质 告 诉 我 们 ， 一 标 堆 有 序 树 的 根 包含 树 中 最 小 关键 字 。， 

第 一 个 性 质 隐 含 着 有 mn 个 节点 的 二 项 堆 五 包含 至 多 [ lgnl + 1 保 -- “项 树 。 为 摘 清 楚 这 
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一 局 ， 注 意 到 的 二 进 表 示 中 有 |1 lgn4 + 1 位 ， 例 如 是 <b ， 


Le8nl LIlen] 一 ] 
从 而 mn 一 了 开光 b,2 。 所 以 ， 根 据 引 理 20.1 中 的 性 质 上 可知 ， 二 项 树 B, 出 现 于 妞 中 当 且 仅 
当 位 b = 1。 这 样 ， 二 项 堆 耳 包含 至 多 1 lgnj 二 1 棵 一 项 树 。 


图 20.3(a)】 示 岂 了 包含 13 个 节点 的 二 项 堆 H。13 的 二 进 表 示 为 <1101> ， 故 也 包含 了 
堆 有 序 二 项 树 B;，B,， 和 Bu， 它们 分 别 有 8，4 和 1 个 节点 ， 即 共有 13 个 节点 。 {a) 该 堆 
由 二 项 树 BO，B2 和 B3 构成 ， 它 们 各 有 1，4 和 8 个 节点 ， 总 共有 = 13 个 节点 。 由 于 每 
棵 二 项 树 都 是 堆 有 序 的 ， 所 以 任意 节点 的 关键 字 都 不 小 于 其 父 节 点 的 关键 字 。 图 中 还 示 出 了 
根 表 ， 它 是 一 个 按 根 的 度数 的 递增 序 排 列 的 链表 。 


1 b， 2 ， 
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图 20.3 具有 nmn= 和 全 个 节点 的 二 项 堆 了 


二 项 堆 的 玫 示 


站 图 20.3(b) 示 出 了 二 项 堆 日 的 一 个 更 具体 的 表示 。 每 棵 二 项 树 按 左 孩 子 、 右 兄弟 表 
未 方式 存储 ， 每 个 节点 存储 其 自身 的 度数 。 每 个 节点 都 有 个 关键 字 域 以 及 其 他 依 应 用 要 求 而 
定 的 卫星 数据 。 另 外 ， 每 个 节点 x 还 包含 指向 其 父 节 点 的 指针 P[x]， 指 向 其 最 左 孩 子 的 指针 
child[x]， 以 及 描 击 x 的 仅 右 兄弟 的 指针 sibling[xl]。 如 果 节 点 xx 是 根 ， 则 PIX]= NIL。 如 果 节 ， 
点 X 没 有 子女 ,. 则 child[ 刁 = NIL。 如 果 x 是 其 父 节 点 的 最 右 孩 子 ， 则 sibling[xj= NIL。 每 
个 节点 关 还 包含 域 degree[xl]， 即 x 的 子女 个 数 。 
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如 图 20.3 所 示 ， 一 个 之 项 堆 中 的 各 二 项 树 的 根 被 组 织 成 一 个 链表 ， 我 们 称 之 为 根 表 。 
当 我 们 在 遍历 根 表 时 ， 各 根 的 度数 是 严格 增加 的 。 根 据 第 二 个 二 项 堆 性 质 ， 在 一 个 悍 节 点 
的 二 项 堆 中 各 根 的 度数 构成 了 {0，1; …， gm 的 一 个 子 集 。 对 根 节点 与 非 根 节点 来 说 ,: 
sibling 域 的 含义 是 不 同 的 。 如 果 x 为 根 ， 则 sibling[x] 指 向 根 表 中 下 一 个 根 《 像 通常 一 样 ， 
如 果 x 为 根 表 中 最 后 一 个 根 ， 则 sibling[lx]= NIL)， 

一 个 给 定 的 二 项 堆 王 可 通过 域 headfh] 来 取 接 ; 这 个 域 指向 日 的 根 表 中 的 第 一 个 根 。 
如 果 二 项 堆 互 不 包含 任何 元 索 ， 则 head[H] = NIL. 





图 20.4 -二 项 树 阳 ,， 其 各 节点 按 后 序 遍 历 侈 序 标 以 一 个 二 进 数 
20.2 ”二 项 堆 上 的 操作 


这 一 节 里 ， 我 们 要 介绍 如 何在 图 20.1 中 给 示 的 时 间 界 内 执行 二 项 堆 上 的 操作 ， 我 们 将 
只 给 出 上 界 ， 下 界 留 作 练 习 20.2 一 10。 


创建 一 个 新 的 二 项 堆 


为 了 构造 一 个 空 的 二 项 堆 ， 过 程 MAKE--BINOMIAL-HEAP 分 配 并 返回 一 个 对 象 ， 
且 head[hij= NIL， 该 过 程 的 运行 时 间 为 HCL) 。 


寻找 最 小 关键 字 


过 程 HINOMIAL-HEAP~-MINIMUM 返回 一 个 指向 包含 na 个 节点 的 一 项 堆 忆 中 具有 
最 小 关键 字 的 节点 的 指针 。 这 个 实现 假定 淮 有 一 个 关键 字 值 为 ce ( 见 练习 20.2-5) 。 


RINGOMIAL-HEAP-MINIMUMIOH) 
1 ys<-MIL 
xbhead[I] 
从 j 人 -一 局 
while  X 夫 NI 
do 让 key[xl<min 
then Imin< 一 key[x] 
Y“-X 

X< -时 世 nx] 

returr y 


因为 一 个 二 项 维 是 堆 有 序 的 ， 故 最 小 关键 字 必 在 根 节点 中 - 过 程 ， 
BINOMIAL-HEAP-MINIMUM 检查 所 有 的 根 〈 至 多 有 | 1gnj +1)， 将 当前 最 小 者 存 于 


大 肥 -] 对 LUn 三 
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min 中 ， 而 将 指向 当前 最 小 者 的 指针 存 记 yy 之 中 。 当 对 疼 20.3 中 的 二 项 堆 调 用 时 ， 
BINOMIAL-HEAP-MINIMUM 返回 一 个 指向 具有 关键 字 ] 的 节点 的 指针 。 

因为 至 多 棍 检 查 1 lgnj +l! 个 根 ， 故 BINOMIAL-HEAP-MINIMUM 的 运行 时 间 为 
QI)。 


合并 两 个 二 项 堆 


合并 两 个 二 项 堆 的 操作 可 用 作 后 面 大 部 分 操作 的 一 个 子 程序 。 过 程 
BINOMIAL-HEAP~UNION 反复 连接 和 根 节 点 的 度数 由 癌 的 各 一 项 树 。 下 面 的 过 程 将 以 节 
点 y 为 根 的 Bt_， 树 连 接 起 来 ; 亦 即 ， 它 使 得 z 成 为 y 的 父 节 点 ， 并 成 为 一 棵 B 树 的 要 . 


BINOMIAL-LINK(9，z] 

1 ByhP-z ! 
2 Sbling[y]<-childz| 

3 chiltd[zjw 

4 degree[ 四 degree[z+i 


过 程 BINOMIAL-LINK 在 DO 时 间 内 使 得 节点 y 成 为 节点 z 的 子女 链表 的 新 头 。 
这 个 过 程 之 所 以 能 正确 地 运行 ,因为 每 棵 一 项 树 的 左 孩 子 、 碳 兄弟 表示 与 树 的 排序 性 质 正 好 
匹配 : 在 一 棵 Bk 树 中 ， 根 的 最 左 孩 子 是 一 棵 Bi 桂 的 恨 。 

下 面 的 过 程 合并 二 项 堆 Hi 和 Ba， 并 返回 结果 堆 。 在 合并 过 程 中 ， 它 也 癌 时 破坏 了 于 
和 H; 的 表示 。 除 了 BINOMIAL-LINK 之 外 ， 这 个 过 程 还 使 用 了 一 个 辅助 过 程 
BINOMIAL--HEAP~-MERGE 来 将 H 和 H; 的 根 表 合并 成 一 个 按 度数 的 单调 递增 次 序 排 
列 的 链 邢 。BINOMIAL-HEAP-MERGE (其 伤 代码 我 们 和 贸 作 练习 20.2--2) 与 1.3. 中 的 
MERGE 对 程 是 类 似 的 。 


BINOMIAIL 一 HEAP~-UNIDNCE， 开 -) 

1 了 =-MAKE~-BINCOMIAL 一 HEAEB 》 

2 head[H-BINOMIAL-HBEAP~-MERGEILH,， 2 

3 释放 对 象 HH 和 五, 担 不 列 出 它们 所 指 的 内 容 

4 这 head[HB]=NIL 

then returm 妃 

和 Prev 一 X< 一 NI 工 

7 xn -headfS] 

省 meXt 一 Xibl 训 贞 x] 

四 while mext 一 xX- 关 MI1L 

10 do 这 (degheefxj 上 drgree[next 一 X]) Or 
(sibling[next 一 X]- 关 NIL | 

and xiegree[sibling[next 一 x]=- degree[xh) 


11 then Prev 一 x<- 心情 况 1 和 2 
12 Xe next 从 人 情况 1 和? 
13 证 Xey[xj 袜 key[next-j 

14 then siblin 台 xx] 一 Sbtinglnext 一 x] ， 六 情况 3 
1 BINOMIAL 一 LINKLnext 一 Xx，xX) 六 情况 3 
16 。 else 让 Prev 一 xx 一 NIL 大 情 再 4 
17 then headfH< next 一 x 入 情况 4 
18 else siblingiprev 一 xX]< -mext 一 X 办 情况 4 
19 BINGMTIAL 一 LINKAIXK。next 一 X] 六 情况 4 


2 Xe neXH 一 X 太 情 况 4 
21 mext 一 X<~sibling[x] 
22 Teturn 


图 20.5 示 出 了 BINOMIAL-HEAP-UNION 的 一 个 例子 ， 其 中 出 现 了 代码 中 给 出 的 
四 种 情况 。(a) 一 项 堆 | 和 H,。({b) 二 项 堆 日 是 BINOMIAL-HEAP--MERGE(H,， 
Ha) 的 输出 。 开 始 时 ，x 是 互 的 根 表 上 的 第 一 个 根 。 图 为 x 和 next-x 的 度数 都 为 0, 且 ， 
key[x] < Key[next 一 x]， 这 与 情 癌 3 对 应 (elj 在 链接 发 生 后 、x 是 基 有 相同 志 数 的 演 个 根 中 
个 ， 这 与 情况 2 对 应 。{d) 在 根 表 中 所 有 指针 都 向 下 移动 一 个 位 团 后 ， 情 况 4 适 
有 用， 图 为 x 是 两 个 具 碳 相 几 度数 的 根 中 的 第 一 个 。 (e) 在 发 生 链 接 后 ， 悄 况 3 适用 。 ( 们 在 
另 -一 次 链接 后 ， 情 况 上 适用 ， 图 为 < 的 度数 为 3、next-x 的 度数 为 4。while 循环 的 这 一 次 
执行 也 是 最 后 的 -次 ， 图 为 在 根 表 中 的 各 指针 向 下 移动 … 个 位 置 乒 ，nextx= NIEL。 


斌 





是 说 用 于 


四 Cnse 了 


图 20.5 BINOMIAL-HEAP-UNION 的 执行 过 程 





BINOMIAL-HEAP-UNION 过 程 有 两 个 阶段 。 第 -个 阶段 中 执行 对 BINOMIALI 一 
HEAP- MERGE 的 调用 ， 将 二 项 堆 HI 和 H。 的 根 表 合并 成 一 个 链表 王 ， 它 按 度数 排序 成 
单调 递增 次 序 。 然 而 ， 对 于 每 -一 个 度数 可 能 有 两 个 根 (但 不 可 能 更 多 了 )， 直 到 对 每 个 度数 
硅 多 有 一 个 根 。 因 为 链表 H 是 按 度 数 排序 的 ， 所 以 我 们 可 以 很 快 地 租 各 种 链表 覃 作 。 

具体 来 说 ， 该 过 程 的 工作 过 程 是 这 样 的 : 
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第 1-3 行 先 将 二 项 堆 HH 和 再 > 的 根 表 合 并 成 一 个 根 表 蔬 。H, 和 HT 的 根 表 是 按 严 格 赐 
增 的 度数 来 排序 的 ， 而 BINOMIAL-HEAP-MERGE 返回 一 个 按 单调 递增 度数 排序 的 根 
表 H。 如 果 HI 和 H; 的 根 表 共有 mm 个 根 ， 则 BINOMIAL-HEAP-MERGE 可 在 OUlm) 时 
间 反 复 检 查 两 个 根 表 尖 上 的 根 ， 并 和 将 度数 较 低 的 根 搁 至 输出 根 表 ， 同 时 将 其 从 输 人 根 表 中 去 
掉 。 


下 


一 全 和 车 共 
ou 


[eegtd 玫 ] 让 


Case3 









和 


图 20.5( 续 ) 


过 程 BINOMIAL-HEAP-UNION 接着 对 指 沿 H 的 根 表 的 某 些 指 针 进 行 初始 化 。 首 
先 ， 在 第 4-S$ 行 申 如 果 引 好 是 在 合并 两 个 空 二 项 堆 的 话 ， 则 返回 。 那 么 我 们 就 知道 ， 从 第 6 
行 开 始 ， 焉 至 少 有 一 个 根 。 在 整个 过 程 中 ， 我 们 保持 三 个 指向 根 表 的 指针 : 
. X: 指向 目前 被 检查 的 根 可 
“Prev 一 x: 指向 根 表 中 x 的 前 一 个 根 ， 即 siblingfprev 一 oj 一 x 
. next-x:， 指向 根 表 中 x 的 后 一 个 根 ， 即 sibiing[xj = next 一 x 
开始 时 ， 对 一 个 给 定 度数 再 的 根 表 上 至 多 有 两 个 根 : 因为 Hi 和 H: 为 两 个 一 项 堆 ， 对 
一 个 给 定 的 户 数 它们 都 各 只 含有 一 个 根 与 之 对 应 。 另 外 ，BINOMIJAL-~ HEAP- MERGE 
保证 了 如 果 五 中 的 两 个 根 具 有 相同 度数 ， 则 在 根 表 中 它们 是 相 邻 的 。 
实际 上 ,在 BHINOMIAL-HEAP~-UNION 的 执行 过 程 中 ， 在 有 的 时 刻 卫 的 根 表 中 本 
能 会 有 三 个 根 具 有 相同 的 度数 。 待 一 会 儿 我 们 将 看 到 这 种 情况 是 怎么 可 能 发 生 的 。 在 第 
9-21 行 中 的 while 循 坏 的 钳 … 次 执行 中 ， 要 根据 x 和 next-x ( 共 苗 siblingfaext 一 xj 的 度数 
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来 确定 是 否 把 两 者 连接 起 来 。 该 循环 的 一 种 变形 是 每 次 进入 树 环 体 时 ，x 和 next-x 都 是 非 
NIL 的 . 

四 20.6 了 未 出 了 标记 a，b，c 和 1 仅 用 于 区 别 所 牵涉 到 的 根 ; 它们 并 不 表示 关键 字 或 这 
匡 根 的 度数 。 在 每 种 情况 中 ，x 是 - 标 B,- 树 的 根 ，. 且 1]> kk。 





PFC Y et 人 tne 二 JPew- 站- 罗 
全 一 一 > 全 加 …， 
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四 顺丰 关 - 
Prevw-Y 交 Tetr- ARTEST-AY] 
(ee)》 本 曲 闻 二 国生 [ 
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此 9| 二 ] 裤 二 PC- 
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用 
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Prey-Y 击 
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已 站 已 “ 品 ， 及 
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图 20.6 在 BINOMIAL-HEAP-UNION 中 发 年 的 四 种 情况 


情况 1 〔 见 图 20.6(a) 发 生 的 条 件 是 degree[] 天 degree[nex 二 可 亦 即 ，x 为 一 棵 Bi 树 
的 根 而 next-x 为 一 棵 B 树 的 的 桶 ， 且 1>k， 第 11~12 行 处 理 了 这 种 情况 。 我 们 并 不 连接 x 
和 next-x， 只 是 将 指针 指向 表 中 的 下 一 个 位 置 。 在 第 21 行 中 更 新 了 next-x， 使 之 指向 新 节 
点 X 之 后 的 节点 。 这 个 处 理 对 所 有 情况 都 是 一 样 的 。 

情况 2 〈 如 图 20.6(b) 所 未 ) 当 x 为 具有 相同 度数 的 三 个 根 中 的 第 一 个 时 发 生 ; 亦 即 ， 
当 degreeEx] 一 degree[nexti- 对 = degree[sibling[next 一 xl 时 发 生 ， 我 们 对 这 个 情况 的 处 理 与 情况 
1 相同 : 将 指针 又 一 次 移 向 表 中 下 一 个 位 置 。 第 10 行 测试 情况 1 和 情 现 2， 和 情况 2， 第 
li-12 行 对 两 种 情况 都 作 了 处 理 ， 

情况 3 和 4 当 x 为 具有 相同 度数 的 两 个 根 中 第 一 个 时 发 生 ; 亦 即 ， 当 

degree[x] = degree[mnext 一 x] 一 degree[sibiinglmnext 一 xj 

灶 发 生 ， 

这 些 可 能 在 下 一 次 循环 中 发 生 任 何 情况 之 后 ， 司 有 一 -种 情况 总 是 紧 随 情况 2 而 发 生 ， 在 
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情况 3 和 4 中， 我 们 将 x 与 next-x 相连 接 。 这 两 种 情况 是 根据 x 和 next-x 岂 一 个 具有 更 小 
的 关 刍 字 玉 区 分 的 ; 这 个 区 分 条 件 决 定 了 在 这 是个 根 连 接 后 哪 一 个 节点 将 成 为 根 。 

如 图 20.6(e) 押 示 ， 在 情况 3 中 有 : 情况 3:_ degreefxj= degree[next--x]-Edegree fsibling 
[next 一 xX]j，key[x] 和 keyfnext-X]， 故 将 next-x 连接 到 xx 上 。 第 14 行将 nextx 从 根 表 中 去 
掉 ， 第 1 行使 next-x 成 男 x 的 和 茹 左 孩 子 便 建 了 一 则 RB- 树 - 

在 情况 4 中 ， 旭 图 20.6d) 所 示 ，dergeelx =degree[ next- Xi: 关 degree [sibling 
fnext~x 耻 ， 用 keyfpext-xj 和 keyfxl]，next-x 具有 和 宣 小 的 关键 字 ， 故 将 x 连接 到 nextrx 上 : 第 
1618 行将 x 从 根 开 中 去 搞 ， 这 又 有 两 种 情况 ， 取 决 和 下 x 是 《第 47 行 ) 还 是 不 是 . (第 18 
行 ) 根 表 中 的 第 一 个 根 。 第 19 行使 x 成 为 next-x 的 地 在 孩 和 于， 第 2 行 介 新 xx 以 进 人 下 -… 
欠 循 环 . 

存 情 况 3 或 情况 4 之 后 ， 为 while 循环 的 下 一 区 执 行 所 杭 的 设 轩 是 相同 的 。 我 们 刚刚 连 
接 了 两 个 B, 树 以 形成 … 棵 B，, 树 、 即 现在 xx 所 措 向 的 树 。 在 BINOMIAL- HEAP- 
MEGRE 的 输出 的 根 琢 中 已 有 0，1， 焉 3 个 其 他 的 卫 ， 柯 ， 丰 更 在 x 战 为 根 表 上 上 的 1，2 
或 3 棵 Bl 树 中 前 第- 个， 如果 促 有 xx 一 个 ， 则 在 下 … 轮 循环 中 进入 情况 .1，degree[xj- 
degreelnext- 菩 。 如 果 x 是 两 个 中 的 第 一 个 ， 则 在 下 一 轮 循 斥 中 进 人 情况 3 或 情况 4。 当 为 
- 习 个 中 的 第 一 个 时 我 们 才 在 下 …… 轮 择 环 中 进入 悄 碗 2。 

BINOMIAL-HEAB-UNIGON 的 运行 时 间 为 On 的 ， 革 中 为 一 项 的 Hi 和 H， 中 疙 
的 节点 个 数 。 我 们 可 以 这 样 来 说 明 这 个 时 间 : 设 症 | 包 人 沼 mn 个 节点 ， 列 ; 世 会 n 个 币 点 ， 从 
了 n=ni+n， 又 因为 HH 包含 于 你 1 赴 m] 1 个 根 ，Hy 全 售 芝 多 和 这 nn + 个 恨 ， 破 在 
调用 BINOMIAL~HEAP-MERGE 后 H 纪 合 至 多 1 ln + nj 上 +2 和 2 过 D 
+2=Otgn 个 根 ， 执 行 BINOMIAL-HEAP-MERGE 的 时 间 为 QUOlgny，whilg 笠 环 的 
和 邦 次 执行 的 时 间 为 DID， 又 因为 在 每 次 循环 中 成 者 将 指 针 指 向 H 的 根 表 中 的 上 一 个 位 ， 或 
者 内 根 表 中 去 控 一 个 根 ， 富 是 就 总 款 要 执行 于 当下 星 0 二 1 起 上 +2 次 循环 。 所 以 ， 总 
的 时 间 为 QOC 证 mn)。 


揪 入 一 个 节点 


下 面 的 过 程 将 节点 x 揪 人 二 项 堆 开 【假定 节点 X 已 被 分 配 ， 忆 ep 人 记 有 和 。 


BINGOMILAL 一 HEAP_INSERT(H， X] 

1 和 好 -MAKE-BINGOMIAL 一 HEARI ) 

2 Pix*-NTL 

3 chiiqfg<-MNLL 

4 Sibling[xl|< NI 

depreedx]s 站 

和 heacd[H > 虽 

7 和 <RINOMIAL-EEAP-LUNIONUN，H 


这 个 过 程 先 在 O() 时 间 册 构造 一 个 只 包含 一 个 节点 的 一 项 堆 H， 和 再 在 O(lg nm) 时 间 
内 将 其 与 包含 mn 个 节点 的 二 项 堆 HB 合并 .对 BINOMIAL-HEAP--UNION 的 订 用 还 负责 
释放 临时 二 项 堆 H'。 ( 另 一 种 不 调 蛋 BINOMIAEL--REAP-UNION 的 直接 实现 在 练习 . 
20.2--8 中 给 出 。) 
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抽取 具有 最 小 关键 字 的 节点 

下 面 的 过 程 从 一 项 堆 H 中 抽取 具有 最 小 关键 字 的 节点 并 返回 一 个 指向 该 节点 的 指针 。 
BINOMIAL--HEAP-EXTRACT-MINOH) 
1 在 H 的 根 表 中 技 出 县 有 最 小 关键 字 的 根 x， 并 将 其 从 表 中 去 掉 
2 HAMAKE 一 BINOMIAL-HEARI ) 

3 将 x 的 子 妈 链表 道 转 次 座 ， 并 让 head1] 指 向 结果 表 

4 


HH<-BINOMIAL--HEAE-UNIONGE， 了 3 
Teturr 天 


全 人 


(b) AradiH] 人 
二 

(c) headlHl 人 
地 


(由 head 一 (人 








图 20.7 BINOMIAL-HEAP-EXTRACT-MIN 的 操作 过 程 


这 个 过 程 的 工作 如 图 20.7 所 示 。 输 入 二 项 堆 H 如 图 20.7(a) 所 示 ; 图 20.7(b) 示 出 了 
第 1 行 后 的 情形 : 具有 最 小 关键 字 的 根 x 被 从 了 的 根 表 中 去 掉 。 如 果 x 为 一 棵 了 寿 的 根 ， 
则 根据 引 理 20.1 的 性 质 4，x 的 各 子女 从 左 到 右 分 别 为 Bi,，Bi_;，…，Bo 树 的 根 。 图 
20.7(c) 说 明了 通过 在 第 3 行 中 道 转 的 x 的 子女 表 ， 我 们 可 以 得 到 一 个 包含 x 的 树 中 除 x 而 
外 的 每 个 节点 的 二 项 推 下 '。 因 为 在 第 1 行 中 x 的 树 已 祖 去 摊 ， 页 第 4 行 中 合并 囊 和 开 所 得 
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的 结果 二 项 堆 (如 图 20.7(d) 所 示 ) 包含 原先 H 中 除 x 以 外 的 所 有 节点 。 最 后 ， 第 5 行 返 
回 X。 

因为 如 果 百 有 na 个 节点 的 话 ， 第 1-4 行 中 的 每 一 行 的 时 间 都 为 DO( 这 和 ， 故 
BINOMIAL 一 HEAP-EXTRACT-MIN 的 运行 时 间 为 OU(lg m)。 


对 一 个 关键 字 减 值 


下 在 的 过 程 将 二 项 堆 理 中 的 某 一 节点 x 的 关键 字 减 为 一 新 值 KK。 如 果 下 大 于 x 的 更 行 
关键 字 值 ， 这 个 过 程 就 引发 一 个 错误 。 


BINOMIAI 一 HEAP-DRECREASE 一 下 EYAGX KE 

1 认 长 > key[x] 
， then erreor new Key 话 Sreater than current Key 
3 key[x]--k 

在。 了 < 一 其 

5 ze ply 

6 while zkNIL and keyfy]<key[z] 

?了 do exchaung key[yj 一 ~keyfz] 

8 从 如 果 Y 和 z 有 .也 是 城 . 也 交换 它 有 

人 了 十- 

0 z<Ply] 


Pt 


图 20.8 示 出 了 这 个 过 程 的 操作 过 程 : (a) while 循环 的 第 一 次 执行 (第 5 行 ) 前 的 情 
形 。 节 点 y 的 关键 字 降 为 7， 小 于 y 的 父 节 点 z 的 关键 字 。 (b) 对 这 两 个 节点 的 关键 字 进行 
交换 。 同 时 示 出 在 第 $ 行 中 循环 的 第 二 次 执行 前 的 情形 。 指 针 y 和 z 称 向 树 中 的 上 一 层 ， 但 
仍然 违反 了 堆 序 要 求 。 (c) 再 微 一 次 交换 ， 并 将 指针 y 和 z 向 上 移 一 层 ， 就 可 以 最 终 满 足 堆 
序 要 求 ， 故 while 钳 环 结束 。 这 个 过 程 以 与 二 叉 堆 中 相同 的 方式 来 减 小 一 个 关键 字 ， 使 该 关 
键 字 在 堆 中 *“ 骨 泡 上 升 "。 在 确保 新 关键 字 不 大 于 当前 关键 字 并 将 其 赋 给 x 后 ， 该 过 程 就 沿 树 
上 升 ， 开 始 时 y 指向 节点 x。 在 第 6-10 行 中 while 竺 环 的 每 一 次 执行 中 ， 将 key 罗 与 y 的 父 
节点 荆 的 关键 字 作 比较 。 如 果 y 为 根 或 key[yj] 关 key 本 则 该 二 项 树 已 是 堆 有 序 的 了 。 和 否则 ， 
节点 y 就 违反 了 堆 序 ， 故 要 将 其 关键 字 与 其 父 节点 z 的 关键 字 相 交换 〈 同 时 还 要 交换 其 他 的 
卫星 数据 )。 然 后 ， 这 个 过 程 将 y 置 为 z， 在 树 中 上 升 一 层 ， 并 继续 下 一 次 钳 环 . 

BINOMIAL--HEAP-DPECREASE--KEY 过 程 的 时 间 为 Q(ig 区 。 根 据 引 理 20.1 的 性 
质 2，x 的 最 大 深度 为 1 霹 nJ， 故 第 6 -10 行 中 while 循环 至 多 执行 1 1g njJ 次 。 


删除 一 个 关键 宇 


很 容易 在 DO(1gn) 时 间 内 从 二 项 堆 于 中 删除 一 个 节点 x 的 关键 字 及 卫星 数据 ， 在 下 面 
的 实现 中 我 们 外 定 当前 在 二 项 堆 中 的 所 有 节点 的 关键 字 都 不 为 -cc。 
BINOMIAL-HEAP-DELETE(H，zx 


1 BINOMIAL--HREAP-DECREASE- 开 ERYIH，x， 一 2) 
2 BINOMIAIL 一 HEAP-EXTRACT-MINOHD) 


这 个 过 程 使 节点 x 在 整个 二 项 堆 中 具有 唯一 最 小 的 关键 字 ， 即 给 其 一 个 关键 字 -ce ( 练 
习 202-6 处 理 了 -ce 不 能 作为 关键 字 出 现 的 情形 )， 然后， 通过 调用 
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BINOMIAL-HEAP_DECREASE-KEY 来 使 该 关键 字 及 其 卫星 信息 家 泡 上 升 至 树 根 。 再 
通过 调用 BINOMIAL~-HEAP-EXTRACT-MIN 来 将 根 从 区 中 去 掉 。 
过 程 BINOMIAL--HEAP-DELETE 的 时 间 为 OUlgn) 
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20-1t 2-3-4 堆 


第 十 九 章 中 介绍 了 2-3-4 树 ， 其 中 每 个 内 节点 〈 非 根 ) 有 两 个 、 三 个 或 四 个 子女 ， 且 
所 有 的 时 节点 的 深度 相同 。 在 这 个 问题 里 ， 我 们 来 实现 2 一 3-4 堆 ， 它 支持 可 侣 并 堆 的 操 
作 。 

2 一 3-4 堆 与 2 一 3 一 4 树 有 一 些 不 同 之 处 。 在 2 一 3 一 4 堆 中 ， 关 键 字 公 存 在 于 时 节点 中 ， 且 
每 个 叶 节 点 X 仅 包 含 一 个 关键 字 于 其 key[x] 域 中 。 另 外 叶 节 点 中 的 关键 字 之 间 没 有 什么 特别 
的 次 序 ; 亦 即 ， 从 左 至 右 来 看 ， 各 关键 字 可 以 排 成 任何 次 序 。 每 个 内 节点 和 包 信 一 个 值 
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smajlfgx]， 它 等 于 以 x 为 根 的 子 树 的 各 叶 节点 中 所 存储 的 最 小 关键 字 。 根 了 包含 一 个 域 
height[j， 即 树 的 高 度 。 最 后 ，2 一 34 堆 主 要 是 在 主 存 中 的 ， 故 无 需 任 何 磁 盘 读 或 写 。 

请 实现 下 面 各 2--3-4 崔 操 作 。 对 包含 n 个 元 素 的 2-3-4 堆 ，(a] - (人 e) 中 的 每 个 操作 
的 运行 时 间 都 应 是 Of(lg non。 (和 中 的 UNION 操作 的 运行 时 间 应 是 D(lg nm， 其 中 必 为 两 
个 输入 堆 中 的 元 素 个 数 。 。 

aDECREASE--KEY， 它 将 某 一 给 定 的 时 节点 x 的 基 键 学 减 小 为 一 给 定 的 值 去 
key[x. 

b.MINIMUM， 它 返回 一 个 指向 包含 最 小 关键 字 的 指针 。 

cINSERT， 将 具有 关键 字 K 的 叶 节点 x 插 人。 

d.DELETE， 删 除 一 给 定 的 时 节点 x。 

e.EXTRACT-MIN， 抽 取 具 有 最 小 关键 字 的 叶 节 点 。 

fUNION， 合 并 两 个 2-3-4 扒 ， 返 回 一 个 2 一 3 一 4 堆 并 破坏 了 输 和 人 夫 


20-2 采用 可 合并 堆 的 是 小 生成 树 算 法 


第 二 十 四 章 要 介绍 两 个 解决 在 一 无 向 图 中 寻找 一 个 最 小 生成 树 的 问题 的 算法 。 这 里 我 们 
可 以 胜 到 如 何 利用 可 合并 堆 来 设计 一 个 不 同 的 最 小 生成 树 算 法 ， 

给 定 一 个 连通 的 无 向 图 台 =(VY，E)， 以 及 权 函 数 w: E-> 芭 。 称 wu，Y) 为 边 〈u， 
v) 的 权 。 我 们 希望 找 出 G 的 一 个 最 小 生成 树 : 一 个 无 环 子 集 TSE， 它 连接 V 中 所 有 项 
点 ， 且 总 的 权 为 


wfT) = 》 we，V) 


为 最 小 
下 面 的 艾 代 码 构造 一 棵 最 小 生成 树 T, 可 用 24.1 茸 的 技术 来 证 明 这 个 过 程 是 正确 的 。 对 
V 始终 保持 一 个 划分 {VY， 且 对 每 个 Vi， 有 一 个 与 Vi 中 顶点 关联 的 边 的 集合 
EiE{fo，v: ugYi 或 vEVj 


MST--MERGEABLE-HEARIG) 

] 工 <- 由 

2 for 每 个 viEVIG] 

] 局 VTvj 

4 Ef (w，v 《E[G]} 

有 有 hille 移 于 一 个 集合 Wi 

和 do 选择 任 一 集合 Vi 

了 从 孔 中 抽出 最 小 权 边 介 ， 如 
吕 假设 ut YY | KR 


9 让 i 坟 j 

] then T<-TL 有 Ho，W 
1 ViViLUW， 酸 坏 Vi 
12 Bi 一 EL 


请 说 明 如 何 用 图 20.1 中 给 出 的 可 合并 堆 操作 来 实现 这 个 算法 。 候 定 可 合并 堆 是 用 二 项 
堆 实 现 的 ， 所 给 出 的 实现 的 运行 时 间 笃 样 ? 
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练习 二 十 


20.4-1 假设 x 为 一 个 .二 项 堆 中 基 棵 二 项 树 中 的 一 个 节点 ， 且 根 定 sibling[x] 夫 NIL。 如 果 x 不 是 根 ， 
则 degreefsibling[zx 了 与 degree[S] 和 出 怎样 ?3 如 昌 x 是 个 和 根 呢 ? 
20.1-2 如果 大名 一 项 堆 的 某 棵 二 项 树 的 一 个 节点 ，degree[p[xll5 degreefx] 相 比 怎样 ? 
20.1-3 ”机 设 我 们 接 后 序 遍 历 将 二 项 树 B, 中 的 节点 标 为 二 进 形式 ， 如 图 20.4 所 示 。 考 虑 深度 i 处 标 为 
1 的 一 个 节点 x， 且 设 j=k-i， 证 明 : 在 x 的 民 进 表示 中 共有 jj 个 1。 恰 包含 j 个 1 的 二 进 k 串 共有 多 少 ? 
证 明 x 的 度数 与 1 的 一 进 友 示 中 最 右 站 的 右边 的 1 的 个 数 相同. 


20.2-] 请 给 出 两 个 各 包含 5 个 元 素 的 二 叉 堆 的 例子 ， 使 得 BUTLD--HEAP 能 在 @(n) 时 间 内 完成 将 
表册 这 两 个 堆 的 数组 的 并 盟 ， 

20.2-2 请 写 出 HINOMIAL-REAP-MERGE 的 盆 代 码 。 

20.2-3 ”请 给 出 将 一 关键 字 为 24 的 节点 搬 人 如 图 20.7(d) 中 所 未 的 一 项 堆 后 所 得 的 结果 一 项 堆 。 

.20.3-4 ”请 给 出 将 关键 字 为 28 的 节点 从 疼 20.8(c) 中 的 二 项 堆 中 删除 后 的 结果 。 

20.2-5 请 解释 如 果 关 掀 字 的 估 可 以 是 ce 的 话 、 为 什么 过 程 BINOMIAL~ HEAP- MITNIMUM 可 能 
无 法 正确 工作 ? 乔 叶 这 个 过 程 的 协和 代码 ， 使 之 在 这 种 情况 下 也 能 正常 工作 ， 

20.2-6 ”人 棚 设 匹 法 表示 员 关 键 字 -oc， 重 写 BINOMIAL-HEAP-DELETE 过 程 ， 使 之 在 这 种 情况 下 也 
能 正确 地 工作 ， 运 行 时 简 仍 应 为 DC] 人 Im， 

20.2-7 讨论 二 项 堆 上 的 插 人 与 一 个 二 进 数 增 倩 的 关系 ， 以 及 合并 两 个 “项 堆 与 糙 两 个 一 进 数 相 如 之 
间 的 关系 . 

20.2-8 根据 练习 20.2- 7. 在 不 调用 BINOMIAL- HEAP- UNION 的 前 提 下 重 瑟 
BINOMIAL-HEAP-INSERT 以 将 一 个 节点 真 接 插 人 一 个 -项 堆 。 

20.2-9 证 骨 : 如 果 将 根 表 按 上 度数 排 成 严格 递 碱 序 〈 而 不 是 严格 递增 序 ]， 仍 可 以 在 不 改变 放 近 运行 时 
问 的 前 担 下 实现 督 一 种 堆 操作 。 

20.2-10 请 找 出 使 BINOMIAL-HEAP-EXTRACT-MIN、BINOMIAI- HEAP- DECREASE- 

了 KEY 以 及 BINOMIAEL- HEAP- DELETE 的 运行 时 间 为 Q(18a) 的 输入 ， 解 释 为 什么 BINOMIALI 一 
HEAP- JNSERT，BINOMIAL- HEAP- MINIMUM 以 及 BINOMIAL- HEAP- UNION 的 最 坏 情况 运 


行 时 间 是 Qtlg 由 ， 而 不 是 QIg nj) 〈 厚 问题 ?一 5)。 
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第 二 十 一 章 . 斐 波 那 契 堆 


在 第 二 十 章 里 ， 我 们 看 到 了 二 项 维 如 何在 DLlgam) 的 最 坏 情 况 时 间 内 支持 研 合 首 堆 操 
作 如 INSERT，MINIMUM，EXTRACT- MIN 和 UNION， 以 及 操作 DECREASE 一 
KEY 和 DELETE、 在 这 一 章 里 ， 我 们 要 讨论 辈 波 那 禹 堆 ， 它 也 支持 园 样 的 一 些 操 作 ， 俱 有 
个 长 处 ， 即 不 涉及 到 删除 元 素 的 操作 有 OU) 的 平 摊 时 间 。 

从 理论 上 来 看 ， 当 EXTRACT-MIN 与 DELBETE 操作 的 数目 相对 执行 的 其 他 操作 的 
数目 较 小 时 ， 斐 波 那 契 堆 是 很 理想 的 。 在 许多 底 用 中 都 会 出 现 这 个 情况 。 例如 ， 某 些 图 论 问 
题 的 算法 对 和 条 边 都 调用 一 次 DECREASE- 和 KEY 调用 。 对 有 许多 边 的 稠密 图 来 说 ， 短 一 
次 DECREASE--KEY 调用 的 DID 平反 时 间 加 起 来 就 是 对 二 六 或 二 项 玲 的 @(lgn) 最 坏 
情况 时 间 的 一 个 很 大 改善 。 到 目前 为 止 ， 用 于 解决 诸如 计算 最 小 生成 树 【第 二 十 四 章 ) 和 寻 
找 单 源 最 短路 径 (第 二 寺 五 章 ) 等 问题 的 渐 近 最 快 算法 都 要 用 到 上 辈 波 那 契 堆 。 

但 是 ， 从 实际 上 和 看， 对 大 多数 应 用 来 说 ， 由 于 斐 波 那 契 堆 的 常数 因子 以 释 序 设计 上 上 的 复 
杂 狂 使 得 它 不 如 踪 常 的 二 叉 (或 k 叉 》 堆 来 得 合适 。 因 此 ， 此 波 那 契 堆 主 要 是 具有 理论 上 
的 起 义 。 如 果 能 设计 出 一 种 与 斐 波 那 契 堆 有 相同 的 平 摊 时 间 界 但 又 简单 得 多 的 数据 结构 ， 那 
么 它 也 就 会 具有 很 大 的 实用 价值 

”和 二 项 堆 一 样 ， 斐 波 那 契 堆 由 一 组 树 构成 。 实 际 上 ， 这 种 堆 是 松散 地 基于 一 项 堆 的。 如 
果 不 对 斐 波 那 扣 堆 做 任何 DECREASE-KEY 或 DELETE 操作 ， 刚 堆 中 的 每 棵 树 就 和 项 
堆 中 的 树 一 样 。 两 种 堆 的 区 别 在 于 ， 斐 波 那 契 堆 的 结构 更 松散 -- 些 ， 从 而 可 以 改善 渐 近 时 间 
需 。 对 结构 的 维护 工作 可 被 延迟 到 方便 时 再 做 。 

像 18.4 节 中 的 动态 程序 设计 一 样 ， 辈 波 那 契 堆 担 供 了 一 个 以 平 所 分 析 为 指导 思 趣 来 说 
计数 据 结构 的 很 好 的 例子 。 在 这 一 章 稍 后 部 分 对 斐 波 那 契 卉 操 作 的 分 析 中 大 量 应 用 了 18.3 
节 中 的 势能 方法 。 

在 进 人 这 一 章 时 ,我 们 假定 读者 已 经 阅读 过 第 二 十 章 中 有 关 二 项 堆 的 肉 容 了 。 有关 各 种 
堆 操 作 的 规定 和 说 明 ， 以 及 对 一 叉 堆 、 二 项 推 和 斐 波 那 契 堆 上 各 种 操作 的 时 间 界 的 总 结 ， 都 
已 在 第 二 十 章 中 出 现 过 。 我 们 给 出 的 裴 波 那 契 堆 的 结构 要 依 藉 于 二 项 堆 的 结构 。 读 者 还 会 发 
现 ， 斐 波 那 契 堆 上 的 有 些 操作 与 二 项 堆 上 的 是 类 似 的 。 

和 二 项 奴 一 样 ， 斐 波 那 契 堆 也 不 能 有 效 地 支持 SEARCH 操作 的 , 因此 ， 作 用 于 某 一 给 
定 节点 的 操作 就 需要 以 指向 该 节点 的 指针 作为 一 部 分 输 和 人。 

21.1 节 定 义 了 斐 波 那 契 堆 ， 讨 论 了 它们 的 表示 ， 并 给 出 了 用 来 对 它们 进行 平 挫 分 析 的 
势 函 数 。21.2 节 说 明了 如 何 来 实现 可 合并 堆 操作 , 如 何 取 得 图 20.1 中 所 示 的 各 平反 时 间 界 . 
另外 两 个 操作 DECREASE-KEY 与 DELETE 将 在 21.3 节 中 介绍 。 最 后 ，21.4 节 完 成 分 
析 过 程 的 一 个 关键 部 分 。 
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21.1 斐 波 那 契 堆 的 结构 


辈 波 那 契 堆 是 由 一 组 堆 有 序 树 构成 ， 钥 堆 中 的 树 不 一 定 基 二 项 树 。 图 21.1(a) 示 出 了 一 
个 悲 疲 那 契 堆 的 例子 。(aj 由 $ 棵 堆 有 序 树 和 14 个 节点 构成 的 一 个 辈 波 那 契 堆 。 虐 线 指示 
了 根 表 。 堆 中 最 小 节点 为 包含 关键 字 3 的 节点 。 三 个 被 标记 的 节点 都 被 加 黑 了 。 这 个 斐 波 那 
契 堆 的 势 为 sf2x3=11。(b) 一 个 示 出 了 指针 p 【〈 向 上 的 箭头 )、child 【向 下 的 箭头 )、left 
各 fight 〈 例 向 箭头 ) 的 更 完全 的 表示 ， 在 本 章 余 十 的 插图 中 覆 去 了 这 些 细节 ， 图 为 这 里 所 
示 贡 的 所 有 信息 都 可 从 (a) 中 得 到 。 


出 补 [] 





图 21.1 一 个 斐 波 那 契 堆 


-项 坎 中 的 侍者 是 有 序 的 ， 而 斐 波 那 契 堆 中 的 树 都 是 有 根 而 无 序 的 。 如 图 21.1(b) 所 
未 ， 簿 个 节点 x 包含 一 个 指向 其 多 节点 的 指针 名 对 ， 以 及 一 个 指向 其 任 一 子女 的 指针 
child[x]，x 的 所 有 子女 被 链接 成 一 个 环形 的 双 链 表 ， 我 们 称 之 为 x 的 子女 表 。 子 女 表 中 的 每 
个 孩子 y 有 指针 leftd[y] 和 rightfy]， 它 们 分 别 指 向 y 的 左 兄弟 和 右 兄弟 。 如 果 节 点 y 是 唯一 的 
了 于 去， 则 leftlyl=righttyj=y。 各 兄弟 在 子女 表 中 出 现 的 次 序 是 任意 的 。 

在 裴 波 那 契 堆 中 采用 环形 链表 〈 见 11.2 节 ) 有 两 个 好 处 。 首先 ， 我 们 可 以 在 QU) 时 
间 内 将 菜 节 点 从 环形 站 链表 中 去 掉 。 其 次 ， 给 定 两 个 这 样 的 表 ， 我 们 可 以 在 Q(1) 时 间 内 将 
它们 并 置 为 一 个 环形 双 链 表 。 在 对 斐 波 那 契 堆 操作 的 描述 中 ， 我 们 将 非 形式 地 提 及 两 种 操 
作 ， 实 现 上 的 细节 留 给 读者 去 填补 。 

每 一 个 节点 中 的 另外 两 个 域 也 是 很 有 用 的 。 节 点 x 的 子女 表 中 的 子女 个 数 存 储 于 
degree[x] 中 ; 布尔 值 域 mark[x] 指 示 了 自从 xx 上 一 次 成 为 另 一 节点 的 子女 以 来 , 它 是 杏 失 掉 
了 一 个 孩子 。 我 们 先 不 去 管 给 节点 加 标记 的 细节 问题 ， 这 些 问题 留待 21.3 节 讨 论 。 新 创建 
的 订 操 是 没有 标记 的 ， 所 当 一 节点 x 成 为 另 一 节点 的 孩子 时 也 是 设 有 标记 的 。 
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一 个 给 定 的 斐 波 那 契 堆 H 可 以 通过 一 个 指向 包含 最 小 关键 字 的 树 根 的 指针 min[H] 来 访 
问 , 这 个 方 氮 了 驯 称 为 辈 波 那 契 堆 中 的 最 小 节点 。 如 果 一 个 辈 波 那 契 坟 理 是 室 的 ， 则 
rnin[HI= NIL。 

一 个 碟 波 那 韶 堆 中 所 有 树 的 根 都 被 用 它们 的 jeft 和 right 搬 针 链接 成 -个 环形 的 双 甸 
表 ， 称 为 该 堆 的 根 表 ， 于是， 指针 min[HI] 就 指向 根 表 中 具有 最 小 关键 字 的 节点 。 在 根 表 中 
各 树 的 须 序 可 以 是 任意 的 。 

我 们 还 要 用 到 另 一 个 有 尖 斐 波 那 契 堆 开 的 属性 : 于 中 肯 前 所 包含 的 节点 个 数 为 miH]。 


势 调 数 


前 面 已 经 说 过 ， 我 们 将 用 18.3 节 中 的 势能 方法 来 分 析 些 波 那 其 堆 操 作 的 性 能 。 对 一 个 
给 定 的 斐 波 那 奖 堆 日 ， 我 们 KH) 表示 瑞 的 根 表 中 的 树 的 个 数 ， 用 mmGHi 表示 也 中 有 标记 
节点 的 个 数 。 瑟 的 势 定义 为 

TUH) =tHD +2m0H) (21.1) 

例如 ， 现 21.1 中 所 示 的 斐 波 那 契 堆 的 势 为 SH2. 3= 11。 一 组 斐 波 那 契 堆 的 势 为 各 成 分 
堆 的 势 之 和 。 我 们 将 假定 一 单位 的 势 可 以 支付 常数 量 的 工作 ， 此 处 该 常数 足够 大 ， 可 以 禄 盖 
我 们 可 能 遇 到 的 任何 常数 时 间 的 工作 . 

我 们 还 假定 每 一 个 斐 波 那 契 夫 在 开始 时 都 没有 任何 已 建成 的 只 。 于 是 ， 初 始 的 势 就 为 
0， 且 根据 方程 (21.10)， 势 始终 是 非 负 的 。 从 〈18.2} 式 可 知 ， 某 一 操作 序列 的 总 的 平 排 代 
价 的 一 个 上 办 也 就 是 这 个 序列 的 总 的 实际 代价 的 一 个 上 界 。 


最 大 度数 


在 这 一 章 余下 的 凡 节 里 要 做 的 平 排 分 析 中 我 们 都 假定 一 个 包含 n 个 节点 的 张波 那 契 堆 
-中 节点 的 最 大 度数 有 一 个 已 知 的 上 界 D(n) 。 练 习 21.2-3 说 明了 当 仅 支持 可 合并 堆 操作 时 ， 
P(m) =! 地 DJ。 在 21.3 节 中 ， 我 们 将 看 到 当 还 需 支 持 DECREASE--KEY 和 也 ELETE 
操作 时 ，De) =OCign). 


21.2 可 合并 堆 操 作 


这 一 节 里 ， 我 们 要 介绍 并 分 析 用 斐 波 那 契 堆 实现 的 各 种 可 合并 维 操作 。 如 果 仅 需 支持 
MA 政 E-HEAP，INSERT，MINIMUM，EXTRACT-MIN 以 及 UNION 操作 ， 则 每 个 
斐 波 那 契 堆 就 只 是 一 组 "无 序 的 “一 项 树 。 无 序 的 一 项 树 和 二 项 树 -- 样 , 也 是 被 递归 定义 的 。 
无 序 二 项 树 Us 包含 一 个 节点 ， 一 棵 无 序 的 二 项 树 Ui 包含 两 棵 无 序 二 项 树 Uk_ I， 其 中 一 棵 
的 节点 成 为 另 一 棵 的 根 的 子 节点 。 引 理 20.1 中 给 出 的 二 项 树 的 性 质 对 无 序 二 项 树 仍 然 成 
况 ， 但 性 质 4 要 作 如 下 的 变化 ( 见 练习 21,2 一 2): 

4'， 对 无 序 二 项 树 Uks， 根 的 度数 为 K， 它 大 于 任何 其 他 节点 的 度数 . 根 的 各 子女 按 某 种 

次 序 分 别 为 子 树 Uo，UI，…，U_ 的 根 。 

于 是 ， 如 果 一 个 有 nm 个 节点 的 斐 波 那 外 玲 由 一 组 无 序 一 项 树 构成 ， 则 D(n) 一 gpn。 

斐 波 那 契 堆 上 的 可 合并 堆 操 作 的 关键 思想 是 尽 可 能 久 地 将 工作 延迟 。 在 各 操作 的 实现 之 
间 有 个 性 能 权衡 问题 。 如 果 堆 中 树 的 个 数 较 小 ， 则 在 一 次 EXTRACT~MIN 操作 中 可 以 很 _ 
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快 确定 新 的 最 小 节点 。 然 而 ， 正 如 我 们 已 在 练习 20.2--10 中 见 过 的 二 项 堆 的 情形 那样 ， 为 确 
保 树 的 数目 较 小 我 们 要 付出 一 定 的 代价 : 可 能 要 花 到 Q(lg n) 的 时 间 来 向 二 项 堆 中 揪 和 一 
个 节点 或 合并 两 个 二 项 堆 。 我 们 将 看 到 ， 当 向 一 斐 波 那 韶 堆 中 插 人 一 新 节点 或 合并 两 个 斐 波 ， 
那 契 堆 时 ， 并 不 去 合并 树 ， 而 将 这 个 工作 留 给 EXTRACT-MIN 操作 ， 那 时 就 真正 需要 找 
出 新 的 最 小 节点 了 。 


创建 一 个 新 的 斐 波 那 契 堆 


为 创建 一 个 新 的 斐 波 那 契 堆 ， 过 程 MAKE~FIB~HEAP 分 配 并 返回 一 个 斐 波 那 女 堆 对 
像 H， 且 naHBI=0，min[HI=NIL; 此 时 责 中 还 没有 树 。 因 为 {tHI=0，m[H]=0， 该 空 翡 
波 那 契 堆 的 势 Q(HJ =0， 因 此 ，MAKE-FIB-HEAP 的 平 捧 代 价 就 等 于 其 D(1) 的 实际 代 
价 。 


播 入 一 个 节点 


下 面 过 程 将 节点 x 插 人 张波 那 契 堆 H， 并 假定 该 节点 已 被 分 配 ， 且 其 key[x 已 填 有 内 

容 。 
PF18-HEAP-INSERTOH， 芒 

degree[xj-D 

pP[x]< 一 NIL 

child[x]s<-NILL 

1 全 [xj 天 

王 EhtEx]< 一 

inark[x]< 下 和 LSE 

将 包含 x 的 根 表 与 根 表 这 连接 

让 min[H]=MNIL or keyfzxl<keylmin[HI 
then ininfH]“ 一 X 

10 nifRH=<-aTHI+1 


在 第 1-6 行 对 节点 x 的 各 域 进行 初始 化 , 并 构造 其 自身 的 环形 双向 链表 后 ， 第 7 行 在 
O(1) 的 实际 时 间 内 将 x 加 入 到 H 的 根 表 中 。 王 是， 节点 x 成 为 一 棵 单 节点 的 堆 有 序 树 ， 同 
时 也 就 是 韭 波 那 禹 堆 中 的 一 棵 无 序 二 项 树 。 它 没有 尾 何 子女 ， 也 没有 加 过 标记 . 第 8-9 行 
在 必要 时 对 指向 斐 波 那 契 堆 中 最 小 节点 的 指针 进行 更 新 。 最 后 ， 第 10 行 增 加 n[H] 以 反 身 出 
新 增加 了 一 个 节点 。 图 21.2 示 出 将 一 个 具有 关键 字 21 的 节点 插入 图 21.1 中 的 斐 波 那 契 堆 
后 的 结果 。 

(a) 一 个 辈 波 那 契 堆 H。(b) 插入 了 关键 字 为 21 的 节点 后 的 斐 波 那 契 堆 下 。 该 节点 自 
成 一 棵 堆 有 序 树 ， 从 而 被 加 入 到 根 表 中 ， 成 为 根 的 左 兄 弟 。 与 BINOMIAL- HEAP- IN- 
SERT 过 程 不 同 ，FIB-HEAP-INSERT 并 不 对 斐 波 那 契 堆 中 的 树 进行 调整 。 如果 连续 执行 
k 次 FIB~-HEAP~INSERT 操作 ， 则 k 棵 单 节点 树 被 加 到 根 表 中 。 

为 了 确定 FIB-HEAP-INSERT 的 平 摊 代 价 ， 设 H 为 输入 的 斐 波 那 契 玲 ， 互 为 结果 
斐 波 那 契 堆 。 于 是 ，t(H ' ) =tH) +i，mtH  ) =m(HJ， 县 势 的 增加 为 

(《tH) +UD +2m(H))》 一 (t(H) +2m0H)) =1 
因为 实际 代价 为 OU()， 故 平 排 代价 为 D() +1=O(l)。 
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图 21.2 疝 一 个 斐 波 那 契 准 中 择 人 一 个 节点 


寻找 最 小 节点 


一 个 辈 波 那 契 堆 互 中 的 最 小 节点 由 指针 min[H 指 示 ， 故 我 们 可 以 在 O(1) 时 间 内 找到 
最 小 节点 。 又 因为 再 的 势 没有 变化 ， 所 以 这 个 操作 的 平反 代价 就 等 于 其 D(1) 实际 代价 。 


合并 两 个 昌 波 那 契 堆 


:下面 的 过 程 合并 辈 波 那 契 堆 H 和 H;， 同 时 也 破坏 了 H 和 了 


FIB-HEAP-UNIONCH,，H;) 

1 了 <-NMAIE 一 FIB-HEAR 

minfHT 一 omin[H】 

将 Hz 的 柜 表 与 H 的 根 表 连接 

这 (min[Hil=NIL or fin[HNIL and min[H <min[H 
then 王 if]-mia[H] 

nlH- na0E]+Ho[Hz] 

释 居 也 | 和 ]， 

FetHTn 百 


第 1-3 行将 再 和 H;: 的 根 表 拼接 成 一 个 新 的 根 表 ,第 2，4 和 5S 行 设置 H 的 最 小 节点 ， 
第 6 行将 nlH] 置 为 总 的 节点 数 , 第 7 行 中 释放 裴 波 那 契 堆 对 象 HE 和 Ha， 第 8 行 返 回 结果 的 
斐 波 那 契 堆 H。 像 在 过 程 FIHB-HEAP~INSERT 中 一 样 ， 无 需 对 树 进 行 调整 。 

势 的 改变 为 

B(H) 一 和 0H,)》 +G(H2)) 
一 (HEiH2m0H((t(HyH2m0E HH2)H2m0H2) 
一 自 和 
这 是 因为 t(HD) = 区 HI) +ttH)， 且 mH) =mE) +mfB) 。 所 以 ，FIB- HRAP 一 
UNION 的 平 捧 代 价 与 其 QH 的 实际 代价 相等 。 


扩 取 最小 节点 


抽取 最 小 节点 的 过 程 是 这 一 节 中 介绍 的 操作 中 最 复杂 的 。 被 延迟 的 对 根 表 进行 调整 的 工 
作 最 殉 由 这 个 操作 完成 。 下 面 的 盆 代 码 完 成 抽取 最 小 节点 的 工作 。 为 方便 起 见 ， 代 码 中 假定 
当 从 链表 中 删除 一 个 节点 时 ， 仍 在 表 中 的 指针 被 更 新 ， 而 被 抽 职 表 中 的 指针 则 无 变化 。 该 过 
程 还 机 用 到 辅助 过 程 CONSOLIDATE( 稍 后 给 出 )。 


上 爱人 Un 和 Li 


一 292 -一 


FIB-HEAE'-EXTITRACT-MINUI) 


1 ze -min 了 ] 

2 让 NIL 

3 then for z 的 每 个 耶 女 式 

do 将 xx 加 到 也 的 根 表 上 
3 Ptx]<-NIL 

丰 从 百 的 根 袁 中 删 陈 z 

7 证 z 一 rightfz] 

8 then immin[EH<-NEIL 

9 else min[H-right[z] 
] 恕 CONSOLIDATEIH》 
11 ii[L 末 ]“-nIH] 一 1 


12 return 2 
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图 21.3 FIB-HEAP-EXTRACT-MIN 的 操作 过 程 


”如 图 21.3 所 示 ，FIB-HEAP-EXTRACT-MIN 先 使 最 小 节点 的 等 个 子女 都 成 为 一 个 
根 ， 并 将 最 小 节点 从 根 表 中 去 掉 。 然 后 ， 通 过 将 度数 相同 的 根 链接 起 来 ， 直 至 对 应 每 个 度数 
至 多 只 有 一 个 根来 调整 根 表 。 (a) 斐 波 那 契 堆 H。 (b) 将 最 小 节点 Z 从 根 表 中 去 掉 ， 并 将 
其 子女 加 到 根 表 后 的 情形 。(cj - (e) 在 过 程 CONSOLIDATE 的 第 3-~13 行 中 for 循环 的 
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头 三 次 执行 的 每 一 次 以 后 的 数组 A 和 各 棵 树 。 对 根 表 的 处 理 是 从 最 小 节点 开始 并 遵循 right 
指针 而 进行 的 。 每 个 图 都 未 出 了 在 一 次 循环 执行 结束 时 w 和 x 的 值 。(P ~ (hy for 循环 的 ， 
下 一 轮 执行 ， 同 时 还 示 出 了 了 在 第 6-12 行 中 while 循环 的 每 次 执行 结束 时 w 和 x 的 值 。 人 日 
图 示 出 了 while 循环 第 一 次 执行 时 的 情形 。 关 键 字 为 23 的 节点 被 链 向 关键 字 为 7 的 节点 ， 
后 者 由 x 所 指向 。 在 (8) 图 中 ， 关 键 字 为 17 的 节点 被 链 向 关键 字 为 7 的 节点 ， 它 仍 由 x 所 
指向 。 在 《h) 图 中 ， 关 键 字 为 24 的 节点 被 链 向 关键 为 7 的 节点 。 因 为 先前 并 没有 一 个 节 
点 由 A[3] 所 指向 ， 故 在 ,for 循环 执行 结束 时 ，A[3] 被 设 为 指向 结果 树 的 根 。(D - 〈D while 
循环 的 后 四 次 执行 中 的 每 一 次 以 后 的 情形 。 (m) 在 通过 数组 A 以 及 确定 新 的 mmin[H] 指 针 而 
重 构 根 表 后 的 斐 波 那 契 堆 本 。 





疼 21.3( 续 ) 


第 1 行 中 先 保存 指向 最 小 节点 的 指针 z 该 指针 在 最 后 返回 ， 如 果 z=NIL， 则 斐 波 那 契 
堆 开 已 经 为 空 ， 结 束 ; 否则 ， 像 在 过 程 HINOMIAL--HEAP-EXTRACT-MIN 中 一 样 ， 
道 过 在 第 3 一 5 行 中 使 z 的 所 有 子女 均 成 为 根 (将 它们 放 人 根 表 ) 来 从 RH 中 期 除 节 点 z， 并 
在 第 6 行 中 将 z 从 根 表 中 去 掉 。 如 果 z=right 四 在 第 6 行 以 后 成 立 ， 则 z 为 根 表 中 唯 … 的 攻 
点 且 没有 玉女 ， 于 是 所 有 余下 的 工作 就 是 在 返回 z 之 前 在 第 8 行 中 使 斐 波 那 契 堆 为 空 。 理 
则 ， 让 指针 minfH] 指 向 根 形 中 的 一 个 非 z 的 节点 《在 这 个 情况 里 ， 即 right[fz) 。 图 21.3 
(b) 示 出 了 图 21.3(a) 中 的 辈 波 那 契 堆 在 执行 了 第 9 行 后 的 结果 。 

下 一 步 要 调整 H 的 根 表 ， 即 减少 斐 波 那 契 堆 中 树 的 数目 ,这 由 调用 
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CONSOLIDATE(H) 来 完成 。 对 根 表 的 调整 过 程 即 反复 执行 下 面 的 步 又 ， 直 到 根 表 中 的 每 
个 根 都 有 一 个 不 同 的 degree 值 
1. 在 根 表 中 找 出 两 个 具有 相同 度数 的 根 x 和 YYy， 且 key[x] <keyfy]. 
2. 将 y 与 x 链 接 : 将 y 从 根 表 中 去 掉 、 再 使 y 成 为 x 的 一 个 孩子 。 这 个 操作 由 
FIB--HEAP-LINK 过 程 完成 。 域 degree[x] 被 增值 ， 且 如果 yY 上 有 标记 的 话 也 被 去 
掉 。 
过 程 CONSOLIDATE 使 用 了 一 个 辅助 数组 4A0 .Dn[H]) ], 如 果 Ail=y， 册 当前 的 y 
是 个 degree[y] 一 =i 的 根 。 
CONSOLIDATE(UED) 
1 for is-0 to RnIH]) 
之 do 二 <-NTL 
for 在 下 的 模 表 中 的 每 个 结 点 ， 则 


了 

帮 do Xe 明 

5 ddegree[x] 

白 while 和 Id 关 NIL 

了 do ys -点 吉 ] ， 

g 让 keyfx] > keyfy] 1 
9 thgn 交换 ze 一 y 

1 FIB--H 诗 AP-_ILINKIOH y，Xj 
It 点 [dj-MNIL 

12 过 <-dH 

13 上 AI[ 四 <-x 

it4 rninFH]<NiL 


1 for jn<0 to DinIHE]) 
1 do 诺 二 中 关 NTIEL 


17 then 将 A 加 胃 到 .也 的 根 表 中 
18 这 minfH=NIC or keyA[ 训 一 key[minbb] 
19 then inin[H]<-A 跨 


FIB-HEAP-LINK(H，y，x) 

1 共 开 的 根 表 中 去 掉 

2 使 y 成 为 x 的 一 个 子 节点 ， 增 加 degree[x]; 

3 iparklyj=-FALSE 

具 体 来 说 ，CQONSOLIDATE 过 程 如 下 工作 : 在 第 1-2 行 中 ， 对 A 进行 初始 化 ， 置 每 

一 个 人 口 为 NIL， 在 完成 对 每 个 根 w 的 处 理 后 ， 它 结束 于 以 某 节 点 x 为 根 的 树 中 ,，x 可 能 
(也 可 能 不 ) 与 w 相同 。 数 组 人 口 A[degree[x]] 被 设 成 指向 x。 在 第 3-13 行 的 for 循环 中 ， 
对 根 表 中 的 每 个 根 w 进行 检查 。for 循环 的 每 一 次 执行 中 不 变 的 是 节点 x 为 包含 节点 w 的 
根 。 第 612 行 的 While: 循 环 中 保持 了 不 变 式 d= degsee[xzj (除了 在 第 11 行 中 外 ， 一 会 儿 我 
们 将 看 到 ) .在 wiike 循环 的 每 一 次 执行 中 ，A[dj 指 向 某 个 根 y。 因 为 
d 一 degree[x] = degree[y]， 我 们 希望 将 x 与 y 链接 起 来 。x 和 y 两 者 中 具有 较 小 关键 字 者 在 链 
接 操 作 之 后 就 成 为 另 一 个 的 父 节点 ， 攻 如 有 必要 的 话 则 在 第 8-9 行 中 交换 指向 x 和 y 的 指 
针 。 然 后 ， 在 第 10 行 中 通过 调用 FIB-HEAP-LINK(H，Yy，x) 来 将 y 链 到 xx 上。 这 个 调 
用 增加 degree[x]， 却 使 degree[y] 仍 为 4。 因 为 节点 y 不 再 是 个 根 ， 则 在 第 11 行 中 从 数组 A， 
去 摊 指 向 它 的 指针 。 因 为 degreeEx] 的 值 因 为 调用 FIB-HEAP-LINK 而 增加 ， 故 第 12 行 恢 
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复 不 变 式 d=degreefx]。 重 复 while 循环 直到 A[dj= NIL， 在 这 种 情况 下 没有 曾 的 根 的 度数 
与 的 相同 。 第 13 行 中 我 们 将 Ad 署 为 x， 并 执行 foer 循环 的 下 一 轮 选 代 。 图 21.3fc) -- 
(e) 示 册 了 数组 A 以 及 第 3-13 中 fof 循环 的 头 三 次 执行 后 的 结果 树 。， 在 for 循环 的 于 -- 次 
执行 中 ， 发 生 二 次 链接 ， 结 果 如 图 21.3(0 - (mn 中 所 示 。 图 21.3(i) - (D) 中 示 出 了 fer 
循环 的 下 四 次 执行 的 结果 。 

当 第 3-13 行 的 for 环 结束 后 ， 第 14 行 清空 根 表 ， 第 15-19 行 重 新 构造 根 表 。 所 得 
的 辈 波 那 契 堆 如 轿 21.3(m) 所 示 。 在 调整 根 表 后 ，FIB-HEEAP-EXTRACT-MIN 通过 在 
第 11 行 中 减 小 n[H] 并 在 第 12 行 中 返回 一 个 指 岗 被 删除 节点 并 的 指针 而 结束 。 

请 注意 , 如 果 斐 普 那 契 堆 中 所 有 的 树 在 执行 FIB-HEAP-EXTRACT-MIN 前 都 是 无 序 
二 项 树 ， 则 在 此 以 后 它们 也 都 蚌 无 序 一 项 树 ， 树 发 生变 化 的 方式 有 2- 种。 首先 ， 在 
FIB-HEAP-EXTRACT-MIN 的 第 3 一 5 行 中 ， 根 z 的 每 个 护 子 x 成 为 -~ 个 很。 根据 练习 
21.2 一 2， 每 棵 新 的 榴 都 是 无 序 二 项 树 ，。， 其 次 ， 仅 当 若 干 棵 树 有 相间 的 度数 时 才 财 
FIB-HEAP-LINK 把 它们 连接 起 来 。 因 为 在 链接 表 前 所 有 的 树 都 是 泡 序 二 项 树 ， 若 两 棵 树 
的 根 都 特有 上 个 子女 则 它们 必 上 其 有 Uni 的 结构 。 和 于 是 ， 链 接 所 得 的 树 就 失 有 LU 的 结构 。 

现在 我 们 就 可 以 来 证 明 从 一 个 包含 n 个 节点 的 张波 那 奥 堆 中 抽取 最 小 节点 的 平 挫 代价 
为 DIDtn))。 设 H 表示 为 执行 FIB-HEAP-EXTRACT-MIN 操 帮 前 的 斐 波 那 狐 堆 ， 

抽取 最 小 节点 的 实际 代价 可 如 下 来 计算 。 因 为 在 FIB-HEAP-EXTRACT-MIN 中 对 
多 要 处 理 最 小 节点 的 Dln) 个 子女 ， 再 加 上 第 1-2 行 和 14-19 行 中 CONSOLIDATE 所 做 
的 工作 ， 合 起 来 的 时 间 代 价 为 QUDP(n)) 。 再 来 分 析 一 于 第 3-13 行 中 的 fer 循环 。 在 调用 
CONSOLIDATE 时 根 的 大 小 为 至 多 为 Dan) -Ht(H) -1， 国 为 它 包含 原来 的 tH) 个 根 表 节 
反 ， 再 减 去 被 抽取 的 节 扣 ， 加 上 被 抽取 节点 的 子女 (〈 至 多 有 DOn) 个 )。 在 第 6--12 行 的 
while 循环 的 每 一 次 执行 中 ， 有 一 个 根 要 被 链接 到 另 一 个 上 ， 则 for 循 坏 中 所 佑 的 工作 总 量 
耶 多 与 Plan) +t(H) 成 正比 。 这 样 ， 总 的 实际 工作 量 为 O(Dtn) -+ti0H))。 

在 抽 育 最 小 节点 之 前 的 势 为 TH)J +2m(H)， 而 在 此 之 后 的 势 至 多 为 【DOn) +1) 
+2m(H， 因 为 该 操作 之 后 至 客 留 下 DIn) +1 个 根 ， 且 操作 中 淡 有 和 任何 节点 被 如 标记 。 所 
以 ， 总 的 平 摊 代 价 至 多 为 

ODn) +t(H)) +( (DPInj +1) +2mfH)) 一 《ttH) +2m0H)) 
=OD(n)) +OGCHD)) 一 t(HD) 
=OLUDn) ) 
因为 我 们 可 以 调 大 势 的 单位 来 决定 OKH)) 中 隐藏 的 常数 。 从 直觉 上 上 看， 执行 每 一 次 链接 
的 代价 是 由 链接 使 根 的 数目 减少 1 而 引起 的 势 的 减少 来 支付 的 。 


21.3 ” 减 小 一 个 关键 字 与 删除 一 个 节点 


这 一 节 旦 ， 我 们 苔 介绍 如 何在 OfI) 的 毕 摊 时 间 里 减 小 辈 波 那 莫 和 礁 中 某 节 点 的 关键 字 
值 ， 以 及 如 何在 OUDn)) 的 平 摊 时 间 内 从 包含 nm 个 节点 的 斐 恋 那 某 堆 中 删除 一 个 节点 。 这 
些 操作 不 保持 辈 波 那 契约 中 的 所 有 树 都 是 无 序 二 项 树 的 性 质 。 但 它们 非常 接近 ， 因 而 我 们 可 
用 QUigm) 来 限界 最 大 度数 Dtm 。 证明 这 个 界 则 隐 售 了 FJB--HEAP-EXTRACT-MIN 和 
FIB-HEAP-DELETE 的 平 捧 运 行 时 间 为 O(1gD) 。 
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减 小 一 个 关键 字 


在 下 面 FIB--HEAEP-DECREASE-KEY 的 的 代码 中 ， 我 们 假定 从 一 链表 中 删除 一 个 节 
点 并 不 改 亦 被 删除 节点 的 结构 域 。 


FI1B-HEAPF 一 DECREASE 一 KEYLIH，X， 业 ) 
1 让 天 >Key[x] 

then error *new Key 语 greater than Current key 
Keyjx]<-K 
yn” 
计 YNIL and Key[x< keyfy] 

thena CUTILH，X。， 人 区 

(ASCADING-CUTUE，y) 

记 “keytx] < keytmin[H]] 

thetn tmin[H]= xx 


虽 的 全 hi 上 


CUTIH，x， 久 
1 将 xx 从 y 隐 子 艾 亚 中 峙 险 ， 乱 小 degree[yj 
2 将 x 加 人 下 的 根 去 
3 BINTIL 
二 Imnafk[x<…PFALSE 


CASCADING-CUTIH，yYy) 

1 ze ply] 

2 下 zzFNIL 

好 then 让 matrkly]=FEALSE 

theno marg[y]-TRUE 

else CUTTIH，y7，z) 
CASCADING-CUTIUH，z2) 


FIB-HEAP-DECREASE- 和 KEY 过 程 是 这 样 工作 前 : 第 ] 一 3 行 确 保 新 关键 字 不 大 于 x 
的 当前 关键 字 ， 并 独 新 关键 字 赋 给 x。 如 果 x 为 根 或 key[x 关 key[y]， 此 处 了 为 工 的 多 他 
点 ， 则 雹 禹 发 生 什 何 结构 上 的 变化 ， 因 为 排序 并 没有 被 违反 。 第 4-5 行 测试 这 个 条 件 。 

如 果 排 序 被 建 反 了 ， 贴 村 发 生 很 多 变化 。 上 在 第 6 行 切断 x。 过 程 CUT“* 切 断 "x 与 其 父 
节点 y 立 间 的 链接 ， 使 x 成 为 一 个 根 .。 

我 们 用 mark 域 来 获得 所 求 的 时 间 界 , 它们 有 助 于 产生 下 面 的 效果 。 假 设 革 为 经 历 了 如 
下 恋 化 的 一 个 节点 。 

1. 在 基 个 时 刻 ，x 是 个 根 。 

2. 然 后 X 被 链接 到 六 一 六 战 。 

3. 再 通过 “CUT" 末 去 除 x 的 两 个 子女 。 

… 且 第 二 个 孩 闻 也 先 掉 后 ，xX 与 其 父 节 点 之 了 间 的 联系 就 被 切断 了 ， 并 成 为 ~- 个 新 根 。 如 
果 发 生 了 第 1 步 和 第 2 步 ， 生 x 的 一 个 孩子 被 切割 掉 了 ， 则 域 mark[x 为 TRUE。 于 是 ， 
CUT 过 程 在 第 4 行 清 掉 mark[xl]， 因 为 它 执行 了 第 ! 步 。 (现在 我 们 就 能 撤消 楚 为 什么 
FIB-HEAP-LINK 的 第 3 行 清 掉 了 mark[yj: 节点 y 被 链 向 另 一 个 节点 ， 故 执行 第 2 步 。 
下 一 次 去 掉 Y 的 一 个 孩子 时 ，immark 上 将 被 办 为 TRUE. ) 


宁 ， (mn 小 
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但 是 事情 还 没有 到 此 结束 ， 因 为 x 可 能 是 其 父 节点 y 被 链 到 另 一 个 节点 后 被 切 掉 的 第 二 
个 孩子 。 所 以 ，FIB-HEAP-DECREASE--KEY 的 第 了 行 对 y 执行 一 次 连锁 切断 操作 。 如 ， 
果 y 是 个 根 ， 则 CASCADING-CUT 过 程 的 第 2 行 中 的 测试 就 返回 。 如 果 y 是 未 标记 的 ， 
则 该 过 程 在 第 4 行 对 其 加 标记 ， 因 为 它 的 第 -个 孩子 刚 被 除去 ; 然后 返回 ， 然 而 ， 如 果 y 是 
有 标记 的 ， 则 说 明 y 刚 失 去 其 第 二 个 孩子 ， 在 第 5 行 中 将 y 切 去 ， 且 CASCADING-CUT 
在 第 6 行 中 对 y 的 父 节点 z 再 递归 调用 其 自身 ，CASCADING-CUT 一 直 语 树 递 最 上 去 ， 
直至 找到 一 个 根 或 未 轴 标记 的 节点 . 

一 且 发 生 了 所 有 的 连锁 删除 ， FIB~HEAP-DEAREASE-KEY 的 第 8-9 行 在 必要 的 情 
况 下 更 新 min[H]， 然 后 结束 。 

图 21.4 说 明了 两 次 调用 FIB-HEAP-DECREASE-KEY 的 执行 过 程 ， 开 始 时 为 图 
21.4(a) 中 所 示 的 斐 波 那 契 堆 。 
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图 21.4 对 FIBS-HEAP--DRCREASE--KEY 的 两 次 调用 


图 21.4(b) 中 所 示 的 第 一 次 调用 不 涉及 任何 连锁 删除 。 (a) 初始 的 斐 波 那 契 堆 。 (b) 关 
键 字 为 46 的 节点 使 其 关键 字 被 降 为 15。 该 节点 成 为 一 个 根 ， 且 它 的 先前 未 被 标记 的 父 节点 
(关键 字 为 24) 也 被 加 上 标记 。 第 二 次 调用 如 图 21.4(c) -- (e) 所 示 ， 包 含 两 次 连锁 删除 
ee 35 的 节点 的 关键 字 被 降 为 5。 在 (ec) 中 ， 该 节点 《现在 的 关键 字 为 3 成 为 一 个 

。 其 父 节点 (关键 字 为 26) 被 标记 ， 故 发 生 连 锁 切 断 。 在 (d) 中 ， 关 键 字 为 26 的 节点 
en 因为 关 
键 字 为 24 的 节点 也 被 标记 了 。 在 (e) 中 ， 这 个 节点 与 其 父 节点 的 联系 被 切断 ， 成 为 一 个 无 . 
标记 的 根 。 在 这 一 点 上 连锁 切断 停止 ， 因 为 关键 字 为 7 的 节点 是 个 根 。 (即使 这 个 节点 不 是 
个 根 ， 连 锁 切 断 也 要 停止 ， 因 为 它 是 未 标记 的 .) FIB~HEAP-DECREASE-KEY 操作 的 
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信 果 示 于 (ej 中 ， 尖 中 minlHj 指 向 新 的 最 小 节操 。 
现在 我 们 要 来 证 明 FIB-HEAP-DECREASE-- 天 EY 的 平 挫 代 价 仅 为 D(1) 。 先 来 确定 
其 实际 代价 。FIB-HEAP-DECREASE-KEY 过 程 要 花 OU 时间 ， 再 加 上 连锁 删除 的 时 
间 。 人 假设 在 一 次 给 定 的 FIB-HEAP-DECREASE-- 必 EY 的 调用 中 要 递 妇 良 用 e 次 CAS- 
CADING-CUT。 每 一 次 调用 CASCADING-CUT( 不 包括 递归 调用 ) 的 时 间 为 D(1)。 这 
样 ，FIB-HEAP-DECREASE--KEBY 的 实际 代价 〈 包 括 所 有 的 递归 调用 ) 就 为 DCc) 。 
下 一 步 来 计算 势 的 变化 。 设 H 表示 FIB-HEAP-DECREASE-KEY 操作 之 前 的 斐 波 
那 契 堆 。 对 CASCADING-CUT 的 每 次 递归 调用 《除了 最 后 一 次 外 ) 删除 一 个 如 了 标记 的 
节点 并 清除 标记 位 。 在 此 以 后 ， 共 有 tH)} +e 棵 树 【原来 的 tH)] 棵 树 ， 由 连锁 删除 所 产生 
的 ce- 一 1 棵 树 ， 以 及 以 工 为 根 的 树 )， 和 至 多 mfH) -e+2 个 加 标记 的 节点 《ec-1 个 节点 被 消 
除 的 标记 ， 而 最 后 一 次 调用 CASCADING-CUT 则 可 能 给 某 一 节点 加 上 了 标记 )。 因 此 
势 的 改变 至 多 为 
((tUHD +c) +20mn0H》 一 c+2)) 一 《EU +2m(0)) 一 4 一 
这 样 ，FIB--HEAP-DECREASE-KEY 的 平 排 代价 守 多 为 
Ofc)y 十 4 一 = 一品 () 
因为 我 们 可 以 调节 势 的 单位 以 支配 Ofc) 中 隐 含 的 常数 ， 
读者 到 现在 就 应 该 清楚 了 为 什么 在 定义 势 函数 时 要 包括 -个 为 有 标记 节点 数 两 倍 的 项 . 
当 一 个 有 标记 节点 y 在 连锁 切断 中 被 切断 时 ， 它 的 标记 位 记 被 清 掉 了 ， 故 势 就 减少 了 2。 一 
个 单位 的 势能 支付 标记 位 的 清除 和 切断 ， 另 一 单位 势 补 人 怪 了 因 节 点 y 成 为 根 而 增加 的 势 。 


弄 除 一 个 节点 


很 容易 在 OUDn)) 的 平反 时 间 内 从 一 个 包含 a 个 节点 的 斐 波 那 契 堆 中 删除 一 个 节点 。 
如 下 面 代 码 中 所 示 。 我 们 假定 在 斐 波 那 契 堆 中 没有 一 个 关键 字 的 当前 值 为 -ec。 
FIB--HEAP-DELETEIHNLx) 
1 上 IB--HE 和 PE- 也 王 怠 及 蕊 下 SEE 一 外 了 YL，X， 一 ce) 
2 FIB-HREAP-EXTRACT-MINIH) . 
FIB--HEAP-DELETE 与 BINOMIAL-HEAP-DELETE 是 类 似 的 。 它 使 x 成 为 斐 波 
那 契 堆 中 的 最 小 和 节点， 方法 是 给 它 一 个 唯一 的 很 小 的 关键 字 -ee。 然 后 ， 由 - 
F]B-HEAP-EXTRACT-MIN 过 程 将 其 从 斐 波 那 契 堆 中 去 掉 。FEIB--HEAP-DELETE 的 
平 秩 时 间 为 FIB- HEAP- DECREASE- KEY 的 Di) 平反 时 间 与 
FIB-HEREAP-EXTRACT-MIN 的 QIDIn)) 平 摊 时 间 之 和 和 。 


21.4 最 大 度数 的 界 


为 证 明 FIB-HEAP-EXTRACT-MIN 和 FIB-HEAP-DELETE 的 平 捧 时 间 为 DClg 
个， 我 们 必须 证 明 在 包含 na 个 节点 的 斐 波 那 契 堆 中 任意 节点 的 度数 的 上 界 Ptn) 为 D(lg 
nj。 根 据 练 习 21.2-3， 当 斐 波 那 契 堆 中 的 所 有 树 均 为 无 序 二 项 树 时 ，Dny = 1 naJ。 但 
是 ，FIB-HEAP-DPECREASE- 民 PEY 中 发 生 的 切割 可 能 引起 辈 波 那 契 堆 中 的 树 违 反 无 序 树 


性 质 ， 这 一 节 里 ， 我 们 要 证 明 因为 一 旦 某 个 节点 失去 两 个 孩子 后 ， 我 们 就 多 它 与 它 的 父 转 点 
之 间 的 联系 切断 ， 故 Pln) 为 DUOlg m) 。 特 齐 地 ， 我 们 要 证 有 明 Da) 所 1 jtogenaJ， 其 中 ， 
由 =(1+VS) 7 2。 

分 析 的 关键 是 这 样 的 : 对 斐 波 那 契 堆 的 每 个 节点 x， 定 义 size(x) 为 以 x :为 根 的 子 树 中 ， 
包括 x 在 内 的 所 有 节点 个 数 《〈 请 注意 x 无 需 在 根 表 中 一 一 它 可 以 是 任何 节点 )。 我 们 将 证 明 
size(x) 为 degreefx] 的 指数 。 请 记 住 ，degree[x] 始 终 是 x 的 度数 的 准确 计数 。 

引 理 21.1 设 x 为 一 斐 波 那 契 堆 中 的 任 一 节点 ， 并 假设 degree[xj=k。 设 Y 1，72，.…， 了 类 
表示 按 与 X 链 接 的 次 序 排 到 的 x 的 子女 ， 从 最 早 的 到 最 迟 的 ， 则 对 i=2，23，,…，K， 有 
degreefy]jz0 且 degree[yj>i2。 

证 明 : degree[yi] 关 0 是 显然 的 。 

对 iz2， 注 意 到 当 被 链接 到 x 上 时 ，y， 风 ，.…，yY-1 都 是 x 的 子女 ,， 辟 我 们 必 有 
degree[x] 关 一 1。 又 仅 当 degree[x] 一 degree[y] 时 ， 才 将 节点 y 链 接 到 xx 上 ，; 履 这 时 又 上 有 
degree[y] >i-1。 在 此 之 后 ， 节 点 嫉 至 多 失去 了 一 个 孩子 ， 因 为 如 果 它 失去 -了 两 个 孩子 的 
话 ， 它 就 被 从 并 切断 了 。 所 以 有 degree[yj] 之 这 2。 

最 后 一 部 分 的 分 析 说 明了 术语 * 斐 波 那 契 纵 ? 的 来 源 。 回 忆 一 下 在 2.2 节 中 有 对 = 有， 


1，2，… 各 个 要 流下 加 数 昌 了 而 四 递 | 区 
F, 一 11 如 采 K= 一 1 
F 十 F 如 果 k 衬 2 


长 一 上 长 一 2 
下 面 的 引 悍 给 出 了 Ex 的 另 一 种 表示 。 
引 理 21.2 对 所 有 的 整数 上 这 ， 
FE， ,一 1 十 > FE， 


1 一 让 
证 明 : 对 攻 上 好 纳 。 当 k=0 时 ， 
1+ 卫 F,=1 十 F， 


1 吧 五 
一 1 二 0 
.一 1 
一 上 ， 


作 归 纳 假 设 为 F,， 一 1 十 补 ，，F,， 我 们 有 
下，: 一 上 上， 十 上 


-rr(rS 


= 1 十 2F; 
下面 的 引 理 及 其 推论 完成 了 全 部 分 析 . 它 利 用 不 等 式 (在 短 习 22 8 中 诈 明 ) 
Fitz> 全 


其 中 为 黄金 分 割 率 ， 在 (2.14) 式 中 定义 为 里 = (ITV5) /2=1.61803… 
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引 理 21.3 设 x 为 一 斐 波 那 帮 堆 中 的 任 一 节点 ， 并 设 基 = degree[ 加 。 那 么 ，size(x) 兰 Flesa 
> 和 ， 此 处 惠 =(iTJYS) 72。 

证 明 : 设 si 为 所 有 满足 degree[zj=k 的 节点 z 中 size(z) 的 最 小 可 能 值 。 显 然 ，s= 
s 一 2，s =3。 数 s 至 老 为 size(xz)。 和 在 引 理 21.1 中 一 样 ， 设 m，y792，…， 灭 表示 X 的 各 
子女 ， 且 按 它们 与 x 链 接 的 次 序 排列 。 为 计算 size(x)] 的 干 界 ，x 和 第 一 个 孩子 Yi(size(yl) 
21) 各 算 一 个 ， 然 后 对 x 的 其 他 子 妇 应 用 引 理 21.1。 我 们 有 : 


Size(X) 六 S， 


到 
>2 十 宙 Si 


现在 我 们 通过 对 上 的 归纳 来 证 明 对 所 有 非 负 整数 K，s。 > F，,。 基 是 KK= 0， 和 上 天 
一 1， 易 证 。 对 归纳 步骤 ， 我 们 假定 萎 六 2 且 对 1=0. 1 四 kk 一 1 有 si; 艺 E ，,。 我 们 有 


上 
Si， 六 之 十 之 5i-: 

让 

世 2 十 了 FF， 
1 一 之 

“ 长 

一 1 十 之 F， 
im 

一 上 4: 


最 后 一 个 等 式 是 由 引 理 21.2 得 出 的 。 
这 样 ， 我 们 就 证 明了 size(x) 郑 s 兰 F， 


推论 21.4 在 一 个 包含 m 个 节点 的 二 波 那 女 夫 中 节点 的 最 大 度数 为 (lgm)。 

证 明 : 设 x 为 舍 n 个 节点 的 斐 波 那 契 堆 中 的 任 一 节点 ，k= degree[xl]。 根 据 引 理 21.3， 
有 mmzsize(x] 关 业 对 不 等 式 取 以 @ 为 底 的 对 数 得 ks 和 logen 。 (实际 上 ， 因 为 k 为 整数 ， 
要 写成 ks 和 1 logsnjJ) 因此 ， 任 何 节点 的 最 大 度数 Dtn) 为 OICIgDm)。 


思 考 题 


21-+ 删除 的 另 一 种 实现 


Pisano 教授 提出 了 FIB-HEAP-DELETE 过 程 的 如 下 的 变形 ， 并 声称 当 要 删除 的 节点 
不 是 出 min[H] 所 指向 的 节点 时 该 算法 运行 得 更 快 。 


PEISANCO-PELETEIHEH，、xX 

1 证 x=timin[ 末 ] 

2 then FIB-HEAP-EXTRACT-MINGUHJ) 

3 elae yb[x] 

4 让 YNILL 

5 then CUTIUH，X，y) 

6 CASCADING-CUTLIH， 切 
了 将 x 的 子女 表 加 到 下 的 根 表 中 
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8 从 开 的 根 表 中 瘟 队 天 


&， 教授 之 所 以 宣称 这 个 过 程 可 以 运行 得 更 快 部 分 是 因为 他 假设 可 以 在 OfUL) 实际 时 间 内 ， 
执行 第 7 了 行 。 他 这 个 假设 错 在 哪里 ? 

b. 请 给 出 当 x 六 minfH] 时 PISANO-DELETE 的 实际 时 间 的 一 个 好 的 上 界 。 所 给 出 | 的 界 
应 以 degree[x] 以 及 对 CASCADING-CUT 过 程 的 调用 次 数 c 来 表达. 

c. 设 五 ”为 执行 一 次 PISANO-~DELETE(UH，x) 后 所 得 的 斐 波 那 站 堆 。 假 定 丰 所 x 不 是 
个 根 。 请 用 degree[xl，c:，tHED 和 mtH) 来 表示 囊 ”的 势 的 界 。 

由 . 证 明 : 即使 当 x 关 minEHI 时 ，PISANO-DELETE 的 平 扒 时 间 从 渐 近 上 看 也 不 比 
FIB-HEAP-DPELETE 好 . 


24-2， 另 一 些 韭 波 那 契 堆 操作 


我 们 希望 增强 斐 波 那 契 堆 也 ， 使 之 支持 两 种 新 的 操作 ， 同时 ， 还 不 改变 其 他 斐 波 闭 契 
堆 操作 的 平 摊 运 行 时 间 。 

a. 操作 FIB-HEAP-~-CHANGE-KEY(H，x，k) 将 节点 x 的 关键 字 改 变 为 k。 请 给 出 这 
个 操作 的 一 个 高 效 的 实现 。 另 根据 长 大 于 ， 小 于 或 等 于 key[x] 等 不 同情 况 来 分 析 的 
实现 的 平 摊 运 行 时 间 。 

b. 操作 FIB-HEAP-PRUNEIH，D 将 minfr，n[H]) 个 节点 从 互 中 删除 。 请 给 出 这 个 
揉 作 药 一 个 高 效 的 实现 。 删除 哪些 节点 是 任意 的 。 另 请 分 析 所 给 出 的 实现 的 下 排 适 
行 时 间 。 (提示 : 可 能 需要 修改 数据 结构 和 势 函数 .) 、 


练习 二 十 一 


21.2-]1 请 给 出 对 图 21.3(m) 中 所 示 的 非 波 那 契 堆 调用 FIB--HEAP-EXTRACT-MIN 后 得 到 的 辈 普 那 
狠 堆 ， 
21.2-2 证 明 : 引 理 20.] 对 无 座 一 项 树 也 成 立 ， 但 要 将 性 质 4 换 成 件 质 十 。 


21.2-3 证 明 : 如 果 仅 需 支 持 可 合并 扒 操 作 ， 则 在 包含 n 个 节点 的 斐 波 那 契 堆 中 节点 的 最 大 度数 


Ptn) 至 多 为 1gn。 

21.2-4 MecGee 教授 设计 了 一 种 新 的 基于 斐 波 那 契 堆 的 数据 结构 。MecGee 堆 与 斐 波 那 净 堆 具 有 相同 的 

构 ， 也 支持 可 合并 堆 操 作 。 各 探 作 的 实现 与 辈 波 那 契 堆 中 的 相同 ， 只 是 搬 人 和 合并 在 最 后 的 步骤 中 做 合 
并 凋 MeGee 堆 的 操作 的 最 坏 情况 运行 时 间 是 多 少 ? 教授 所 设计 的 数据 结构 到 底 有 多 少 新 意 ? 

21.2-5 论证 : 如 果 对 关键 字 的 唯一 操作 是 比较 两 个 关键 字 【如 本 章 的 所 有 实现 中 的 情况 一 样 )， 则 并 
非 所 有 的 可 合并 堆 操 作 都 有 QtI) 的 半 摊 运行 时 间 。 


21.3-1 很 设 一 个 非 波 那 桨 堆 中 的 某 个 根 x 是 有 标记 的 。 请 解释 x 是 如 何 成 为 有 标记 的 根 的 。 另 说 明 x 
_ 有 无 标记 对 分 析 来 说 没有 影响 ， 即 使 它 不 是 个 先 被 链 到 另 一 个 节点 乓 后 又 失去 一 个 子 节点 的 根 。 
21.3-2 用 18.1 节 的 束 介 方 法 来 证 明 FIB-HEAP-DECREASE-KEY 具有 Ofl) 半 反 时间， 


21.4-1 某 人 声称 包含 nm 个 节点 的 斐 波 那 毁 堆 的 高 度 为 D(1ga)。 请 证 明 他 是 错 的 《可 以 给 出 一 个 斐 波 
那 帆 堆 操 作 的 序列 ， 它 创建 一 个 只 包 舍 一 棵 为 ma 个 节点 的 线性 链 的 树 ，n 为 任意 正 整数 .) 

21.4-2 ”人 恨 说 我 们 将 连锁 切断 规则 加 以 推广 ， 使 得 当 某 个 节点 x 一 失去 其 第 攻 个 孩子 就 将 其 与 父 节 点 
的 联系 切断 ， 此 处 让 为 一 整 常数 。 (在 21.3 节 的 规则 中 =2) 上 取 什 么 值 时 有 Dn) =OLlgn)3? 
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第 二 十 二 章 ” 用 于 分 离 集合 的 数据 结构 


在 某 些 应 用 中 要 将 n 个 不 同 的 元 素 分 成 一 组 分 离 的 (或 不 相交 ) 的 集 含 。 有 关 的 两 个 
重要 操作 是 找 出 给 定 的 元 素 所 属 的 集合 和 合并 两 个 集合 。 这 一 章 轨 讨 论 各 种 维护 支持 这 些 操 
作 的 数据 结构 的 方法 . 

22.1 节 描 述 分 离 集合 数据 结构 所 支持 的 操作 ， 并 给 出 一 个 简单 的 应 用 。 在 22.2 节 中 我 
们 要 介绍 分 离 集合 的 一 个 简单 的 链表 实现 。 另 一 种 更 有 效 的 采用 有 根 树 的 表示 方法 将 在 
22.3 节 中 给 出 。 采 用 树 表 示 的 运行 时 间 在 实践 上 来 说 是 线性 的 ， 从 理论 上 来 说 是 超 线性 
的 。22.4 节 定 义 并 讨论 Ackerman 函数 及 其 增长 极其 缓慢 的 赣 画 数 ， 它 出 现在 基于 树 的 实现 
的 各 操作 的 运行 时 间 之 中 ; 然后 ,再 用 平 氛 分 析 来 证 明和 运行 时 间 的 一 个 稍 弱 一 点 的 上 界 。 


22.1 分离 集 合 的 操作 


分 离 集合 数据 结构 记录 了 一 组 分 离 的 动态 集合 8=!1Si，S$:。、…，S$d- 每 个 集合 通过 一 
个 代表 加 以 识别 ， 代 表 邯 该 集合 中 的 某 个 元 素 。 在 某 些 应 用 中 ， 哪 一 个 成 员 被 选 作 代表 是 无 
所 谓 的 , 我 们 关心 的 是 如 果 我 们 要 求 某 一 动态 集合 的 代表 两 次 ， 且 在 两 次 请 求 间 不 履 改 集 
合 ， 则 两 次 得 到 的 答案 应 该 是 相同 的 。 在 另 一 些 应 用 中 ， 关 于 如 何 选择 代表 可 能 存在 某 些 规 
则 或 规定 ， 例 如 选择 集 台 中 最 小 元 素 等 【这 时 ， 当 然 假 定 集合 中 所 有 元 素 是 有 序 的 )， 

像 在 我 们 已 经 研究 过 的 其 他 动态 集合 实现 中 一 样 ， 一 个 集合 中 的 每 一 元 素 是 由 一 个 对 象 
来 表示 的 。 设 x 表示 一 个 对 象 ， 我 们 希望 支持 下 列 换 作 ; 

MAKE-SET(x): 建立 一 个 新 的 集合 ， 其 仅 有 的 成 员 〈 因 而 也 就 是 代表 ) 由 x 所 指 
向 。 因 为 各 集合 是 分 离 的 ， 我 们 要 求 x 没有 在 其 他 集合 中 上 出现 过 . 

UNION(Cx， 妨 : 将 包含 x 和 y 的 动态 集合 (比如 说 $. 和 S$,) 合并 为 一 个 新 的 集合 ( 即 这 
两 个 集合 的 并 )。 假 定 在 这 个 操作 之 前 两 个 集合 是 分 离 的 。 结 果 的 集合 的 代表 是 Ss js， 的 某 
个 成 员 ; 在 UNION 的 很 多 实现 中 选择 S, 或 S, 的 代表 作为 新 的 代表 。 由 于 我 们 要 求 各 集合 
是 分 离 的 ， 故 我 们 “摧毁 "了 集合 S. 和 S,， 并 把 它们 从 S 中 去 掉 。 

FIND-SETCD): 返回 一 个 指向 包 依 x 的 (唯一 ) 集合 的 代表 的 指针 。 

在 整个 这 一 章 中 ， 我 们 将 根据 两 个 参数 来 分 析 分 离 集合 数据 结构 的 运行 时 间 : hn， 即 执 
行 MAKE-SET 操作 的 次 数 ; m， 即 MAKE-SET，UNION， 和 FIND-SET 操作 的 总 次 
数 ， 因 为 各 集合 是 分 离 的 ， 故 每 一 个 UNION 操作 就 将 集合 个 数 减 少 1。 于 是 ， 在 n-1 次 
UNION 操作 后 ， 仅 留 下 了 一 个 集合 。 也 就 是 说 ，UNION 操作 的 次 数 至 多 为 no-1。 请 注意 
在 总 的 操作 次 数 im 中 包括 了 MAKE-SET 操作 的 次 数 ， 故 有 天 n。 
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分 离 集 合 数 据 结构 的 一 个 应 用 


分 离 集合 数据 结构 的 许多 应 用 中 的 一 个 是 确定 一 个 无 向 图 中 的 连通 子 图 个 数 ( 见 54 
节 )。 例 如 ， 图 22.1 示 出 了 (ay 包含 四 个 连通 子 图 {fa，b，c， 丰 ，fe， 开 人 ， 和 由， 半 和 人 
的 一 个 图 ， (bj 在 处 理 了 每 条 边 之 后 的 各 分 离 集合 。 


人 一 站 昌明 四 
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图 22.1 ”连通 子 图 


下 面 的 过 程 CONNECTED-COMPONENTS 利用 分 离 集合 操作 来 计算 一 个 图 的 连通 

子 图 。 一 且 CONNECTED- COMPONENTS 作为 预 处 理 步 又 执行 后 ， 过 程 
SAME-COMPONET 就 能 回答 两 个 节点 是 否 硅 回 一 连通 子 图 中 的 问题 。 { 图 局 的 点 集 肯 
Y[GI 表 示 ， 边 集 用 E[G] 表 示 。) 

CNNECTED-COMPONENTSIG) 

1] for each Vertex YE Www[G] 

2 do MAKE-SETIv) 

3 fpr each edge fn，v ER[G] 


. do 这 FIND-SETIo) 拓 FINP-SETIY) 
5 thenh UNICMNC，Y) 


SAME-COMPONENTIe，v) 

] 让 FIND-SETI =FIND-SETIv) 
了 then return ITRUE 

凶 else TetaIn 下 入 工 SEE 


过 程 CONNECTED-COMPONENT 开始 时 将 每 个 节点 置 于 其 自己 的 集合 中 .. 然后 ， 
对 每 一 条 边 (u，vV)， 它 将 包含 u 和 包含 的 节点 Y 合并 。 根 据 练习 22.1-2， 在 所 有 的 边 者 
被 处 理 后 ， 两 个 节点 在 同一 连通 了 网 当中 仪 当 与 之 相应 的 对 象 在 同一 集合 中 。 这 样 ， 


CONNECTED-COMPONBEBNT 计算 集合 的 方式 使 得 过 程 SAME-COMPONENT 可 以 确 
定 两 个 节点 是 理 在 同一 连通 子 图 中 。 图 22.1(bj 说 明了 CONNECTED-COMPONENTS 
是 如 何 计算 分 离 集合 的 。 





图 22.2 分 离 集合 的 链表 未 与 UNION 操作 


22.2 分 离 集合 的 链表 表示 


”实现 分 离 集合 数据 结构 的 一 种 简单 方法 是 每 一 个 集合 都 用 一 个 链表 来 表示 。 每 个 链表 中 
的 每 个 对 象 都 包含 一 个 集合 成 员 ， 一 个 指向 包含 下 一 集合 成 员 的 对 象 的 指针 ， 以 及 指向 代表 
的 指针 。 图 22.2(a) 示 出 了 两 个 集合 的 链表 表示 。 在 每 个 链表 中 ， 对 象 可 以 以 任何 次 序 出 现 
(但 要 保证 我 们 关于 第 一 个 对 象 是 所 在 集合 的 代表 的 假设 成 立 )， 其 中 一 个 集合 包含 对 象 b， 
c 和 h， 代 表 为 c， 另 一 个 集合 包含 对 象 df 和 g， 代 表 为 了 表 中 的 每 个 对 象 包含 一 个 
集合 成 员 、 一 个 指向 表 中 下 一 对 象 的 指针 ， 以 及 指向 表 中 第 一 个 对 象 〈 即 代表 ) 的 指针 。 

有 了 这 种 链表 表示 ，MAKE-SET 和 FIND-SET 都 变 得 很 容易 了 ， 只 需 O(1) 时 间 。 

为 执行 MAKE-SETCD ， 我 们 创建 一 个 新 链表 ， 其 仪 有 对 象 为 x。 对 FIND-SETCODJ， 只 要 
返回 由 x 反 指向 代表 的 指针 即 可 。 


UNION 的 一 个 简单 实现 
UNION 操作 的 采用 了 链表 集合 表示 的 最 简单 的 实现 也 要 花 比 MAKE-SET 或 
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FIND-SET 多 不 少 的 时 间 。 图 22.2(b) 示 出 了 UNIONC, 思 的 缚 果 ， 所 得 集合 的 代表 为 人 
我 们 是 通过 将 x 的 表 拼 到 y 的 表 尾 上 来 执行 UNION(x，y) 的 。 新 集合 的 代表 为 原先 包含 y 
的 集合 的 代表 。 麻 烦 的 是 ， 我 们 要 更 新 原先 x 的 表 上 所 有 对 象 的 指向 代表 的 指针 ， 要 花 的 时 
间 与 x 的 表 的 长 度 成 线性 关系 。 

实际 上 ,不 难 给 出 一 个 需要 Bltm 时 间 的 包含 im 个 操作 的 序列 ， 我 们 设 n= [myx2] 
+1，q 一 mm 一 一 【 如/ 24 一 1， 并 假设 有 对 象 zj， 恕 ，…， 匣 。 然 后 执行 如 图 22.3 中 所 示 的 
m=n+qg 个 操作 。 执行 个 MAKE-SET 操作 要 花 @n) 的 时 间 。 因 为 第 ii 个 UNION 操 
作 更 新 了 i j 个 对 象 ， 故 由 所 有 的 UNION 操作 所 更 新 的 总 的 对 象 数 为 


Fi-edn 


朵 而 ， 总 的 时 间 为 昌 (n+gq37]， 亦 即 Btm2)， 这 是 因为 na= Ga，q=@tm)。 那 么 ， 平 均 来 
看 每 个 操作 就 筑 要 @(m) 时 间 。 人 也 就 是 说 ， 一 个 操作 的 平 捧 代 价 为 @(m)。 


CO 〇 PEratiof Number of objects updated 
MAKE-SETIX+ ) | 


MAKE-SET(XI)} 1 


ATAKE-SET(Xw} 
UNION(Y ， 罗 ) 
UNIeoN(x3 3】 
(UNIONTY3，X4 


于 


UNoN(x -xn) 7 一: 
图 22.3 ”利用 链表 集合 表示 及 UNION 的 和 个 操作 需要 O(m2) 的 时 间 


一 种 加 权 合 并 启发 式 


上 而 的 UNION 过 程 的 实现 对 每 次 调用 平均 需要 .Btm]j 时 间 ， 因 为 我 们 可 能 是 将 一 个 
较 长 的 表 拼 到 一 个 较 短 的 表 上 ; 我 们 还 必须 更 新 较 长 表 中 每 个 对 象 的 指向 代表 的 指针 。 现 在 
我 们 人 恨 设 每 个 代表 中 还 包括 了 表 的 长 度 〈 这 很 容易 维护 )， 且 我 们 总 是 把 较 短 的 表 拼 到 较 长 
的 表 上 去 ,同时 可 以 任意 打 断 链接 关系 。 在 采用 这 种 简单 的 加 权 合 并 局 发 式 后 ， 如 果 两 个 集 
合 都 有 Qtn) 个 成 员 的 话 ， 一 次 UNION 操作 仍 可 以 只 要 nm 时间。 然而， 从 王 面 的 定 
理 可 以 知道 , 个 MAKE-SET，UNION 和 FIND-SET 操作 的 一 个 序列 〔 其 中 有 nm 个 是 
MAKE-SET 操作 ) 要 花 Otm+Hnlgn) 的 时 间 。 

定理 22.1 利用 分 离 集 合 的 链表 玫 示 和 加 权 合 并 启发 式 ， 一 个 包括 aa 个 
MAKE-SET，UNION， 和 EIND-SET 操作 (其 中 有 日 个 是 MAKE-SET 操作 》 的 序列 
的 时 间 为 DUm+nlgn)。 

证 明 : 我 们 允 来 对 一 个 大 小 为 呈 的 集合 中 的 每 个 对 象 计算 该 对 象 指向 代表 的 指针 被 更 
新 次 数 的 一 个 上 界 。 考 虑 一 个 固定 的 对 象 zx。 我 们 知道 每 次 x 的 代表 指针 被 更 新 时 ，x 必 是 
从 较 小 的 集合 中 开始 的 。 因 此 ，x 的 代表 指针 被 第 一 次 更 新 后 ， 结 果 集 合 必 至 少 售 有 二 
素 。 类 似 地 ， 下 一 次 的 代表 指针 被 更 新 后 ， 结 果 集 合 必 至 少 含有 四 个 元 素 。 继 续 下 去 ， 
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以 注意 到 对 任何 的 k 和 n， 在 x 的 代表 指针 被 更 新 「『 地 k ] 必 后 ， 结 果 集 合 必 有 至 少 含有 k 个 元 
素 。 又 由 于 最 大 的 集合 至 多 包含 n 个 元 寨 ， 克 在 所 有 的 UNION 操作 被 扳 行 后 ， 每 个 对 象 
的 代表 指针 至 多 被 更 新 了 「lga ] 次 。 因 而 ， 更 新 m 个 对 象 所 用 的 总 的 时 间 为 Dtn 培 m)。 

整个 媚 个 操作 构成 的 序列 的 时 间 也 可 以 很 容易 地 求 出 。 每 次 MAKE-SET 和 
_FIND-SET 探 作 需要 DO) 时 间 ， 共 有 DOm)j 次 这 样 的 操作 ， 故 整个 序列 总 的 时 间 为 
CO(m+nalg3n)。 


22.3 ”分离 集合 森林 


在 分 离 集合 的 另 一 种 更 快 的 实现 中 ， 我 们 用 有 根 树 来 表示 集合 ， 树 中 的 每 个 节点 包 禽 集 
合 的 一 个 成 员 ， 每 标 树 表示 一 个 集合 。 在 一 个 分 离 集合 森林 中 ， 每 棵 树 的 根 包含 着 集合 的 代 
表 ， 且 是 它 自 己 的 父 节点 。 (aj 表示 图 22.2 中 两 个 集合 的 两 棵 树 。 左边 的 一 棵 树 表示 集合 
fb，c，e，B}， 其 中 e 为 代表 ; 右边 的 一 棵 树 表 示 集 合 {d，f， 时 j， 其 中 了 为 代表 。 我 们 将 看 
到 ， 虽 然 采用 这 种 表示 的 直观 算法 并 不 比 那些 采用 链表 表示 的 算法 快 ， 但 通过 引进 两 种 启发 
式 一 一 “ 按 秩 合并 * 和 “路 径 压缩 "一 我 们 可 以 获得 已 知 的 渐 近 最 快 的 分 离 集合 数据 结构 . 





《时 
出 22.4 一 个 分 离 集 合 森林 


三 种 分 离 集 合 操作 是 这 样 来 执行 的 : MAKE-SET 创建 一 棵 只 包含 一 个 节点 的 树 。 执 
行 FIND--SET 操作 时 追踪 父 指针 直至 找到 树 的 根 。 在 此 至 根 的 路 径 上 访问 过 的 节点 构成 了 
寻找 路 径 。UNION 操作 使 得 一 棵 树 的 根 指向 另 一 标 树 的 根 。 图 22.4(b) 示 出 了 UNION(e:g) 
的 结果 。 ， 


改进 运行 时 间 的 启发 式 


到 目前 为 止 ， 我 们 还 没有 对 链表 实现 作出 改进 。 一 个 包含 no-1 次 UNION 操作 的 序列 
可 能 会 构造 出 一 棵 为 mn 个 节点 的 线性 链 的 树 。 但 通过 采用 两 种 启发 式 ， 我 们 可 获得 一 个 几 
乎 与 总 的 操作 数 刘 成 线性 关系 的 运行 时 间 。 

第 一 种 启发 式 是 按 秩 合 并 ， 它 与 我 们 用 于 链表 表示 中 的 加 权 合 并 启发 式 是 相似 的 。 其 轧 
想 是 使 包含 节点 的 树 的 根 指向 包含 较 多 节点 的 树 的 根 。 我 们 并 不 显 式 地 记录 以 每 个 节点 为 根 
的 子 树 的 大 小 ， 而 是 采用 了 一 种 能 够 简化 分 析 的 方法 ， 对 每 个 节点 ， 有 一 个 rank 来 近似 子 
树 大 小 对 数 ， 同 时 它 也 是 该 节点 高 度 的 一 个 上 界 。 在 按 秩 合并 中 ， 上 共有 较 小 秩 的 根 在 
UNION 操作 中 要 指向 具有 较 大 秩 的 根 . 


一 307 一 


第 二 种 启发 式 即 路 径 压 缩 ， 它 非常 简单 而 有 效 。 在 FIND--SET 操作 中 我 们 利用 它 来 使 
寻 拨 路 径 上 的 每 个 节点 都 直接 指向 根 节 点 。 路 径 压 缩 并 不 改变 悉 ， 图 22.5 示 出 了 在 
FIND-SET 操作 中 的 路 径 ， 其 中 略 去 了 稍 头 和 自 回 路 。 (a) 在 执行 FDIND-SET(a) 之 前 的 
表示 基 一 集合 的 一 棵 树 。 其 中 三 角 表 示 根 为 所 示 节 点 的 子 树 。 每 个 节点 有 一 指向 其 父 节点 的 


指针 。 (b) 在 执行 FIND-SET(a) 之 后 的 同一 集合 。 此 时 在 寻找 路 径 上 的 每 个 节点 都 直接 
指向 根 。 





图 22.5 在 FIND-SET 操作 中 的 路 径 压 缩 ， 其 中 略 去 了 箭头 和 自 回 路 


分 离 集合 杀 林 的 伪 代 玛 


为 了 实现 一 个 带 按 秩 合 并 启发 式 的 分 离 集合 森林 ， 要 记录 下 秩 的 变化 。 对 每 个 节点 x 
有 一 个 整数 rank[xj， 它 是 x 的 高 度 〈 在 从 x 到 其 某 -一 后 代 叶 节点 的 最 长 路 径 上 边 的 数目 ) 
的 一 个 上 界 。 当 由 MAKE-SET 创建 了 一 个 单元 集 时 ， 对 应 的 树 中 唯一 节点 的 初始 秩 为 “ 
0. 每 个 FIND-SET 操作 不 改变 任何 秩 。 当 对 商 棵 树 应 用 UNION 时 ， 我 们 使 具有 较 高 秩 
的 根 成 为 具有 较 低 秩 的 根 的 父 节 点 。 在 两 个 秩 相 同时 ， 任 选 一 个 根 作为 父 节点 并 增加 其 秩 
值 。 

这 个 方法 表达 成 伪 代 码 如 下 。 我 们 用 pq 表示 x 的 父 节 点 , LINK 过 程 是 由 UNION 调 
用 的 一 个 子 过 程 ， 它 以 指向 两 个 根 的 指针 为 输 人 。 


MA 及 一 SETUxX) 
1 pxj<x 
2 rank[x]j=- 恬 


UNIONC，y) 
1 ELINKIFIND-SETO)，FIND-SET(9)) 


-308-- 人 


LIMRK LIx， 7) 
1 于 rangx> rankfy] 


2 外 en PP[9] 坟 

3 else 习 [Fxjny 

44 这 rank[x=rankfy] 

5 then fanklyj<-rank[yl+l 


带路 径 压 缩 的 FIND-SST 过 程 也 是 很 简单 的 


FIND 一 SETX) 

1 让 xp 

2 thep pg-FIND-SETIPIx]) 
3 eturn pfx] 


过 程 FIND-SET 芷 一 种 两 示 方 法 : 一 趟 是 沾 寻 找 路 径 上 升 ， 家 至 找到 根 ; 另 一 趟 是 漆 
寻找 路 径 下 降 以 更 新 每 个 节点 ， 使 之 直接 指向 根 。 对 FIND-SET(x) 的 每 次 调用 在 第 3 行 
返回 bg[ 中 。 如 果 为 根 ， 则 不 执行 第 2 行 ， 返 回 pIx]=x。 这 种 情况 下 递归 结束 。 和 否则 ， 执 
行 第 2 行 ， 且 参数 为 plxj 的 递归 调用 返 同 一 个 指向 根 的 指针 ，。， 第 2 行 更 新 节点 x， 使 之 直接 
指向 根 ， 并 在 第 3 行 返 问 这 个 指针 。 


启发 式 知识 对 运行 时 间 的 影响 


如 昌 分 开 来 使 用 的 话 ， 按 秩 合 并 或 路 径 压 缩 都 能 改善 分 离 集合 禁 林 操作 的 适 行 时 间 ; 如 
果 将 它们 合 起 来 使 用 的 话 ， 则 改善 的 幅度 会 更 大 。 单 独 来 看 的 话 ， 按 秩 合并 可 产生 与 我 们 对 
表 袁 示 运 用 加 权 人 台 并 启发 式 所 获得 的 同样 的 运行 时 间 : OUm 培 阅 〈 见 练习 22.4-3)。 这 个 界 
是 紧 确 的 〈 见 练习 22.3-3]) 。 如 果 有 nm 个 MAIKE-SET 损 作 【其 中 至 多 有 m 呈 1 个 UNION 
操作 ) 和 ff 个 FIND-SET 操作 ， 巾 单独 立 庶 计 路 径 床 缩 甩 发 式 的 话 ， 当 fn 时， 可 得 到 最 
坏 情 况 运 行 时 间 为 Bdiogle nn)ji 当 f<a 时 ， 为 @tnHfrlgan)。 

当 我 们 同时 使 用 按 秩 合 并 和 有 路径 压 时 ， 最 坏 情 况 运行 时 间 为 DUmnatm，n))， 其 中 
xim，n) 为 Ackerman 男 数 的 增长 极为 缓慢 的 道 函 数 ， 我 们 将 在 22.4 节 中 给 出 它 的 定义 。 
在 任意 可 想象 得 到 的 分 离 集合 数据 结构 的 应 用 中 .atm，alj 近 4， 因 此 ， 在 各 种 实际 情 癌 中 ， 
我 们 可 以 把 这 个 运行 时 间 看 作 与 mm 成 线性 关系 。 在 22.4 节 中 ， 我 们 要 证 明 稍 弱 一 些 的 界 
COtm lg“nmn)。 


* 22.4 ”关于 带路 径 压 缩 的 按 秩 合 并 的 分 析 


我 们 在 22.3 节 说 过 ， 对 作用 于 个 元 素 上 的 m 个 分 离 集合 操作 ， 联 合 使 用 按 秩 合并 和 
路 径 压 缩 启 发 式 的 运行 时 间 为 DOIme(m，m)。 在 这 -- 节 里 ， 我 们 要 介绍 函数 wx， 看 看 它 增 
长 得 到 底 允 慌 。 然 后 ， 我 们 并 不 对 OUmatm，nm)y) 这 行 时 间 关 复杂 证 明 ， 而 是 提供 一 个 关于 
运行 时 间 的 较 弱 的 界 Otm teg *mn) 的 简单 一 些 的 证 明 。 


Ackerman 函数 与 其 逆 函 数 


为 了 理解 Ackerman 函数 及 其 递 函 数 x， 要 先 给 出 一 种 关于 多 重 指数 的 记号 。 对 某 一 整 
数 iz0， 表 达 式 
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了。 村 


表示 郴 数 gG ， 它 由 下 式 递归 定 文 : 


2? 若 i=0 
oo 替 i= 1 
2 车 i> 1 
从 坦 觉 上 看 ， 人 了 “包含 2 的 栈 的 高 度 ”， 该 乒 即 指数 部 分 ， 例 如 ， 
ID 1 一 22 一 ?653 机 
回忆 前 面 给 出 过 的 lg * 函数 的 定义 : 
T 若 i = 
oo 5 若 i> 0 日 jg nm>0 .nb 无 定义 
无 定义 若 i > 0 上 lg 0”n 和 0 或 lg 
lg 丽 数 差不多 就 总 多 重 指数 记号 的 进 : 
lg 22 =n+l 
我 们 现在 就 可 以 来 看 看 Ackerman 郴 数 了 。 对 整数 i， j>> 1， 它 的 定义 为 
AI1， ji =24 j 关 1 
胡 (，1) = 一 太 人 一 1，2) 1 了 
Ai =Ati--1，Afi j- 一 1 ) i，j 六 2 


图 22.6 示 出 了 对 较 小 的 i 和 j 值 该 函数 的 歌 值 。 





图 22.6 大 在 1 和 j 较 小 时 的 取 值 


图 22.7 形 像 地 说 明了 为 什么 Ackerman 函数 会 絮 炸 式 地 增长 。 在 行 i 一 1 和 i 之 间 的 直 
线 表示 了 行 i 一 1 出现 于 行 1 中 的 人 口 。 由 于 该 函数 的 爆炸 增长 ， 横 向 举 标 不 是 根据 比例 给 
出 的 。 行 -1 现 出 于 行 i 中 的 人 口 之 间 的 水 平 上 距离 随 着 列 数 和 行 数 急 剧 增长 。 如 果 我 们 对 
行 1 中 的 各 人 口 蹊 中 至 行 1 中 的 话 ， 则 增长 的 爆炸 性 就 更 加 明显 。 第 1 行为 列 数 的 指数 ， 已 


经 增长 很 快 了 。 第 二 行 包含 了 第 一 行 的 所 有 列 2，22，22 ，22 ，… 的 一 个 分 布 较 广 的 子 
集 构成 ， 相 邻 行 之 间 的 直线 表示 了 较 低 行 的 被 包括 在 较 高 行 的 子 集中 的 各 列 。 第 三 行 由 第 


2 1 


一 行 的 列 2，22 ，22 ”6 ，22 了  ，… 的 分 布 更 广 的 子 集 所 构成 ， 而 第 二 行 义 是 第 一 
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行 的 各 列 的 更 稀 莹 的 一 个 子 集 。 一 般 来 说 ， 第 i 一 1 行 各 个 出 现 于 第 行 中 列 之 间 的 间 虐 随 
列 与 行 数 急剧 增加 。 请 注意 对 所 有 整数 j>1 的 A(2,j) =22 这样， 对 i> 2， 画 ， 
数 Ali, i 比 22 三 增长 得 更 快 。 


Rirmn 


盾 22.7 Ackermann 困 数 的 戟 炸 增长 


Ackerman 下 数 如 下 定 立 
xm，n) =Iminiiz1: Al，mxn) >1gn} 四 

如 果 我 们 固定 mn 的 一 个 值 ， 则 兰 着 m 的 增长 ， 函 数 wm，m) 是 单调 递减 的 。 为 了 搞 清 
楚 这 个 性 质 ， 注 意 到 1 myvnj 是 随 m 增加 而 单调 递增 的 ; 因此 ， 由 于 nm 是 固定 的 ， 故 使 
Ali， L mxnJ) 栅 于 1ga 的 最 小 的 i 值 是 单调 递减 的 。 这 个 性 质 与 我 们 的 甘于 带路 径 压 缩 的 
分 离 集合 森林 的 直觉 是 对 应 的 : 对 于 给 定 的 个 不 则 的 元 素 ， 随 着 操作 次 数 mm 的 增加 ， 可 
以 预期 因为 路 径 压 缩 而 导致 平均 寻找 路 径 长 度 减 小 。 如 果 我 们 在 时 间 Qtmatm，m)?) 内 执行 
mm 个 操作 ， 则 每 个 操作 的 平均 时 间 为 D(xtm，n))， 它 随 问 的 增加 而 单调 递减 。 

为 证 明 前 面 说 过 的 对 任何 实际 应 用 wm，n]j 所 4， 首 先 请 注意 | my nj 至 少 为 1， 因 
为 血 关 0D。 宙 于 Ackermnan 画 教 随 每 个 自 变 量 严格 增加 ， 故 1 mxnj 涯 1， 意味 着 AdG， 
1mxZnjJ 之 Ai，H，i 芝 1。 特别 地 ，A(4，L mxnj) 关 A(4，1)。 另 外 也 有 

At(4，1) = 上 A(3，2) 
2 H6 
这 个 数 远 大 于 可 观察 到 的 字 宙 中 所 估计 的 坟 子 不 数 《 欧 1080) 。 只 有 对 《不 实际 的 ) 大 的 mn 
值 才 有 A(4，1) 所 ]EDn， 因 而 对 所 有 实际 应 用 有 ztm，n) 和 4。 请 注意 界 O(m lg "nj 只 是 
稍 弱 于 界 DGma(m，nj); ] 人 “65536 一 4， ]8 “2 一 5， 故 硅 实际 应 用 中 有 1 “ns 科 S。 


秩 的 性 质 


在 这 一 节余 下 的 内 容 里 ， 我 们 要 证 明 带 按 秩 合并 和 路 径 压 缩 的 分 离 集合 操作 的 运行 时 间 
的 一 个 界 O(m lg “nm) 。 为 了 证 明 这 个 界 ， 先 证 明 秩 的 某 些 属性 。 

引 理 22.2 对 所 有 节点 x， 有 fank[xj 失 rank[p[ 台 ]， 如 果 x 关 p[ 寻 则 厅 等 号 严格 成 立 。 
rank[xj 的 韧 始 值 为 0， 并 随时 提 而 增长 ， 直 到 x 关 pPIx， 从 此 以 后 ，rank[x] 就 不 再 变化 。 
ranklpx] 的 值 是 时 间 的 单调 递增 函数 ， . 
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证 朋 : 利用 22.3 节 中 给 出 的 MAKE-SET、UMNION 和 FIND-SET 的 实现 对 操作 次 数 
进行 归纳 即 可 。 我 们 将 它 留 作 练习 22.4 一 1 

我 们 定 广 Size(x) 为 以 节点 X 为 根 的 树 中 节点 个 数 ， 和 包括 节点 本 考 。 

引 理 22.3 对 所 有 树 根 x，size(x]) 322mmeklx， 

证 明 : 对 LINK 操作 的 次 数 进行 归纳 。 注 意 FIND-SET 操作 既 不 改变 一 个 树 根 的 秩 ， 
也 不 改变 树 的 大 小 

基 : 在 第 一 次 LINK 之 前 引 理 成 立 ， 因 为 秩 的 初始 值 为 0 且 每 棵 树 包 含 侍 少 一 个 节 
点 。 

归纳 假设 : 假设 在 执行 操作 EINK(x，y) 之 前 引 理 成 立 。 届 rank 表示 执行 LINK 之 前 
的 秩 箱 ， 且 rank ”表示 执行 LIN 收 之 后 的 秩 值 。 类 似 地 可 定义 size 和 size 7 。 

如果 rankfxjrank[fyl]， 不 失 一 般 人 性 、 假 定 rankfx] < rankly]， 节 局 y 古 时 LINK 操作 所 


形成 的 树 的 根 ， 且 
size'(y) 一 Sizetxy 十 Size(y) 


2 十 2 


滨 了 
2 Tac 评 于 


raxkg 


mank[y] 


除了 y 之 外 ， 其 他 节点 的 秩 和 大 小 都 设 有 发 生变 化 。 
如 傈 rank[ 一 rank[yl， 节 点 y 允 是 新 树 的 根 ,， 且 
Sizefy) 一 Size(x) 十 Sizefy) 
2 


产 卫 


Fa 人 


Tank[y] 


十 了 


引 还 22.4 对 任意 整数 rz0， 至 密 有 nyz 个 秩 为 T 的 节点 。 

证 明 : 将 rz 的 值 岗 定 。 假 设 当 我 们 和 炊 秩 上 赋 给 一 个 节点 xx (在 MAKE-SET 的 第 2 行 或 
LINK 的 第 5 行 ) 时 ， 对 以 x 为 根 的 树 中 的 每 个 节点 贴 一 个 标签 x。 假 设 适 含 节 点 x 的 硅 的 
根 可 坟 发 生变 化 。 引 理 22.2 确保 了 新 根 的 秩 〈 或 实际 上 ，x 的 某 个 宜 先 的 秩 }) 至 少 为 r1， 
将 为 我 们 仅 当 一 个 根 被 赋予 秩 了 时 才 对 节点 如 慰 答 ， 所 以 这 棵 新 树 中 的 所 有 节点 都 不 会 答 被 
加 标记 ， 这 样 ， 符 个 节点 芋 多 被 加 标 证 一 次 〈 即 当 其 根 被 号 黎 T 时 )》， 叉 因为 其 有 个 切 
扣 ， 上 故 至 多 有 na 个 有 标记 揭 节 点 ， 其 中 对 秩 为 了 的 等 个 节点 胡 了 至 少 生 次 标记 。 如 果 秩 为 了 
的 节点 多 于 ny72 个 ， 则 就 会 有 多 于 25. tn 2 = 个 节点 将 由 一 个 秩 为 了 的 节点 加 标 
记 ， 这 就 构成 了 一 个 着 盾 。 所 以 ， 至 多 有 ny 于 个 节点 被 琴 子 秩 r， 

推 沦 22.5 每 个 节点 的 秩 至 多 为 | 地 nj。 

证 明 : 妇 果 我 们 设 r> lgn， 则 至 饮 有 ny2<1l 个 节点 的 秩 为 +。 因 为 秩 只 可 取 自 然 
数 ， 故 推论 成 立 。 


了 时间 内 的 证 明 


旋 mbnkiTy] 


我 们 将 用 平 捧 分 析 中 的 聚集 方法 来 证 明 Otm jg “pn) 时 间 界 。 在 做 平 捧 分 析 时 ， 为 方便 
起 抑 假 定 我 们 调用 的 是 LINK& 控 作 和 厕 不 是 UNION 操作 ， 亦 即 ， 因 为 LINK 过 程 的 基数 是 
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指向 两 个 根 的 操作 ， 我 们 假定 在 需要 时 就 执行 FIND-SET 操作 。 下 面 的 引 理 说 明了 即使 我 
们 将 额外 的 FIND-SET 操作 也 算 进 来 ， 渐 近 的 运行 时 间 还 是 一 样 的 ， 

引 理 22.6 ”假设 通过 将 每 个 UNION 操作 转换 成 两 个 FIND-SET 操作 后 接 -- 个 LINK 
操作 的 办 法 来 将 一 个 包含 m ” 个 MAKE-SET、UNION 和 FIND-SET 曲 作 的 序列 S$ 7" 转 
换 成 一 个 包含 m 个 MAKE-SET、LINKR 和 FIND-SET 操作 的 序列 $S。 那 么 ， 如 果 序 列 $ 
的 运行 时 间 为 O(m lg“n，、 则 序列 3 7” 的 运行 时 间 为 Om ′1lg *n)。 

证 了 明 : 由 于 序列 S$ ”中 的 余人 个 UNION 操作 都 被 转换 成 $ 中 的 三 个 操作 ， 我 们 有 mn ， 
到 各 近 3nm”。 又 因为 m=Otm” )，、 序 列 $ 的 一 个 Oomlg ny 时 间 界 就 荀 会 着 原 序列 SS 有 
时 间 界 Om ”lg ”nm)。 

在 这 一 节余 下 的 内 容 里 ， 我 们 将 假定 包含 ”个 MAKE-SET、UNION 和 
FIND-SET 操作 的 初始 序 蚀 被 转换 为 一 个 包 例 m 个 MAKKEFE-SET、LJNK 和 和 FIND-SEYT 
操作 的 序列 。 我 们 现在 来 证 明 转 换 后 序列 的 一 个 Qtm lg“m) 时 间 界 ， 并 利用 引 理 22.6 来 证 
峙 包含 呈 ″ 个 操作 的 原 序列 具有 DOm ”jg “na) 运行 时 间 ， 

定理 22.7 ”一 个 包含 和 个 MAKE--SET，LINK 和 FIND-SET 操作 的 序列 (其 中 
个 为 MAKE-SET 操作 ) 作用 于 一 个 带 按 秩 合 并 和 路 径 压 缩 的 分 离 集 合 森林 上 的 最 坏 情 况 
时 间 为 Oftmlg“n)。 

证 明 : 我 们 对 每 一 集合 操作 收取 与 其 实际 代价 对 应 的 费用 ， 并 在 整个 集合 拘 作 序 列 执行 
完毕 后 就 计算 总 的 收费 次 数 。 这 个 总 数 就 给 出 了 所 有 集合 操作 的 总 的 实际 代价 。 

- 对 MAKE-SET 和 LINK 操作 的 收费 是 简单 的 : 每 个 操作 收 一 次 费 。 因 为 这 两 种 操作 
各 需 O(1) 的 实际 时 间 ， 故 所 收取 的 费用 操作 的 实际 代价 相同 。 

在 讨论 FIND-SET 操作 的 收费 前 ， 我 们 将 各 个 节点 的 秩 值 划分 成 块 ， 即 将 秩 r 改 人 块 
lg ff Tr=0，1，…,| inJ。(1 地 5 为 最 大 的 穆 .) 号 码 最 大 的 块 即 为 块 18 (En = 了 
0 一 1 。 为 表示 起 来 方便 ， 对 整数 j-1， 我 们 定义 


若 j= 一 1 

B 人 一 ] 2 若 i=1 

ar 站 
这 样 ， 对 j=0，1，…， 培 ”91， 第 j 个 匡 包 全 了 秩 集 {B0G-1 十 1，B( 广 蔬 +2，…， 卫 

全 上 

我 们 对 FINPD-SET 操作 要 收取 的 两 种 费用 :; 块 费 用 和 路 径 费 用 。 假 设 FIND-SET 开 
始 于 节点 基 Ds 且 寻 找 路 径 包 括 节 咸 其 0 其 9 其 | 其 中 对 1=1，2，…，1， 他 战 Xi 为 
p[x_，x 《是 个 根 ) 为 bb。 对 j=0，1，…，t“n-1， 我 们 对 路 径 上 最 后 一 个 秩 在 块 j 


中 的 节点 收取 一 次 块 费 用 。 (请 注意 引 理 22.2 续 依 了 在 任何 寻找 路 径 上 ， 秩 在 同一 给 定 块 中 
的 各 节点 是 连续 的 .) 对 根 的 季 点 为- 也 收取 一 个 块 费 用 ， 国 为 在 性 何 寻 找 路 径 上 各 节点 
的 秩 是 严格 递增 的 ， 一 个 等 价 的 公式 对 每 个 节点 古都 收取 一 次 块 费用， 使 得 pfx]=x， (5 为 
根 或 其 芒 子 ;， 或 芭 rankpj< 直 rankfx] (包含 xi 的 秩 的 块 与 包含 其 公 节 点 的 秩 的 块 是 
不 同 的 .) 对 寻找 路 答 上 没有 收 事 块 费用 的 节点 ， 对 其 收取 路 和 从 费用 。 

一 且 非 根 的 《或 其 子女 ) 节点 被 征收 了 抉 费 用 ， 册 就 不 会 对 其 征收 路 径 费 用 。 为 摘 清 这 
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一 点 ， 请 注意 每 当 发 生路 和 从 压 缩 时 ， 使 B[zj] 关 x 成 立 的 节点 xi 的 秩 保 持 不 变 ， 但 xi 的 父 节 
点 的 秩 严 格 大 于 交 的 原 父 节点 的 秩 。 天 的 秩 与 其 父 节点 的 秩 之 赣 的 差 是 一 个 关于 时 间 的 单 
调 递增 函数 。 于 是 ， jg "rank[pfxj] 与 “rank[xi] 间 的 差 也 是 关于 时 间 的 单调 递增 函数 。 一 
县 x 与 其 父 节 点 的 秩 处 于 不 同 的 块 中 ， 则 它们 的 秩 将 总 是 分 属于 不 同 的 据 中 ， 对 xi 也 始终 
不 会 青 征收 路 径 费 了 。 

在 每 个 FIND-SRT 中 对 每 个 访问 过 的 节 点 都 收 一 次 费 ， 则 总 的 收费 次 数 即 等 于 在 所 有 
的 FIND-SET 操作 中 访 癌 过 的 总 的 节点 数 ， 这 个 总 数 表 示 了 所 有 FIND-SET 操作 的 实际 
代价 。 我 们 希望 证 明 这 个 总 数 为 DUm 18“n)。 

收取 的 块 费 用 次 数 的 界 是 比较 容易 给 出 的 。 在 一 一 好 给 定 的 寻找 路 么 上 ， 对 每 个 坪 号 至 狗 
征收 一 次 费用 ， 再 加 上 对 弛 和 车 点 的 子 节 点 的 收取 的 一 次 块 费 用 。 _ 因为 其 号 是 从 @ 变 到 位 
“一 1 的 ， 故 对 每 次 FIND-SET 操作 至 多 要 征收 ]g“nrl 次 费用 。 这 样 、 对 所 有 的 
FIND-SET 操作 至 多 要 收取 tig“ n+ti) 次 块 费用 。 

对 路 径 费 用 的 限界 略 有 点 不 加 。 如 果 对 某 节 点 收取 的 是 路 径 费 用 ， 则 在 路 径 压 缩 之 芋 
pfxi] 关 xi， 而 在 路 径 压 缩 中 对 x 赋予 一 个 新 的 父 节 点 。xi 的 新 父 节 点 的 秩 大 于 其 原 父 节 点 的 
秩 。 人 很 设 节点 x 的 秩 在 块 j 中 。 在 克 被 赋予 一 个 其 秩 在 不 同 的 块 中 的 新 父 节 点 之 前 ， 可 对 为 
吴 予 玫 次 新 父 节 点 ， 也 就 是 可 对 着 收取 几 次 路 径 典 用 ? 如 果 丙 在 其 拆 属 块 中 其 有 最 低 秩 
( 亦 即 在 B《j- +1 中 具有 最 低 秩 )， 且 其 各 父 节 点 的 秩 连 续 了 到 值 BO-1 +2，BN-1) 
+3，…，B0)， 则 这 个 次 数 可 取得 最 大 值 。 因 为 共有 8B0) 一 Bt 一 1 个 这 样 的 秩 ， 可 知 当 
某 一 节点 在 志 j 中 时 对 它 至 光 可 收取 BG) ~- Bi -1 次 路 径 费 用 。 

玉 一 步 是 对 秩 在 块 j 中 〈 上 整数 jz>0) 的 节点 全 数 进行 限界 。 (请 岂 忆 根据 引 理 22.2， 一 
朋 某 个 节点 成 为 舅 一 节点 的 孩子 后 ， 它 的 秩 就 固定 了 .) 设 N 0) 表示 秩 在 顽 j 中 的 节 氮 个 
教 , 根据 引 理 22.4 可 知 

NU) 芭 二 
r= 双 -4+1 生 
对 = 一 0， 有 
N(O) =nyv2 二 mn7A2 
一 3 7 = 
一 3n72B(0) 


对 j 1， 我 们 有 
nn 3 ] 
旋 昌 届 十 1 | 2 
了 | 
< - 一-- 
必 县 一 是 志 了 
卫 
交 一 与 
一 -an 
B9) 


于 是 ， 对 所 有 名 整数 j>0 有 NO) <3n7/280). 
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最 后 、 对 秩 在 某 一 块 中 的 最 大 节点 个 数 与 对 该 块 中 每 个 节点 收取 的 路 径 费用 的 最 大 次 数 
之 积 在 所 有 的 芯 上 求 和 。 用 ptn) 表示 所 有 路 径 费 用 的 数目 ， 我 们 有 





地 ”nm 一 上 
pm < 了 元 疝 (B0) -B6-1D -0 
3 
的 之 元 6 矿 Bg) 
nlg*an 
2 


这 样 ， 对 各 次 FIND ~ SET 操作 和 收取 的 总 的 费用 数目 为 O(mtlg "n+i) +nlg ny ， 
也 就 是 O(mlg mn) ， 因 为 由 >n。 又 由 于 共有 On) 个 MAKE 一 SET 和 LINK 操作 ， 所 
以 总 的 时 间 代 价 为 O(mlg m) 。 

推论 22.8 ”一 个 包含 上 个 MAKE-SET、UNION 和 FIND-SET 操作 的 序列 【其 中 沾 
个 是 MAKE-SET 操作 ) 作用 于 一 个 带 按 秩 合并 和 路径 压缩 的 分 离 集 合 森 林 上 的 最 坏 情 况 
时 间 为 Ofmlg “ay)。 

证 骨 : 由 引 理 22.7 和 引 理 22.6 立即 可 得 。 


思 考 题 


22-1 联机 量 小 值 


腊 机 最 小 值 问题 是 对 INSERT 和 EXTRACT-MIN 操作 所 作用 的 一 个 其 元 案 取 自 城 
fl，2，…， 吕 的 动态 集合 工 加 以 维护 。 我 们 已 知 的 是 一 个 包 会 m 个 INSERT 和 症 个 EX- 
TRACT-MIN 调用 的 序列 S，、 其 中 {11，2，…，g9j 中 的 每 个 关键 字 恰 被 插 人 一 次 。 我 们 希望 
确定 每 次 EXTRACT-MIN 调用 返回 的 是 名 个 关键 字 。 特 别 地 ， 我 们 希望 对 一 数组 
eftracted[ 1.. 可 进行 填充 ， 基 中 对 i=1l，2，… ，，extracted[i 是 由 第 i 次 
EXTRACT-MIN 调用 所 返回 的 关键 字 。 该 问题 是 “ 脱 机 "的 ， 意 即 我 们 可 以 在 确定 任何 返 
回 的 关键 字 之 前 处 理 整个 序列 $。 

a. 在 下 商 的 脱 机 最 小 值 问 题 的 例子 中 ， 每 个 INSERT 让 一 个 数 表 东 ， 每 个 

EXTRACT-MIN 由 字母 瑟 表 示 : 
4，8， 且 ，3， 刀 ，9，2，6， 卫 ， 了 ， 闻 ，1，7， 卫 ，5 
将 正确 的 值 填 人 extracted 数 给 。 
为 设计 解决 这 个 问题 的 一 个 算法 ， 我 们 将 序列 $ 分 成 若干 个 同 构 的 子 序列 。 亦 即 ， 我 
们 将 3 表示 成 
T， 刁 ， 王 ， 王 ，1，…， 工 ， 卫 ， 工 
其 中 每 个 E 表示 一 次 EXTRACT-MIN 调用 ， 每 个 6 表示 一 个 〈 可 能 为 空 的 ) INSERT 调 
用 的 序列 。 对 每 个 子 序列 5， 开始 时 我 们 把 由 这 些 操作 插 人 的 关键 字 放 人 一 个 集合 ij， 如 
果 5 为 空 则 它 也 是 空 的 。 然 后 执行 下 面 的 过 程 。 
OPFFE-TLINE-MINIMUMI(Im，m) 
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1 for is-1 放 里 
2 do 确定 j 鳄 1 Ki 
3 if j 夫 md+1 
4 then extracted]- 一 ; 
5 对 香 个 存在 的 集合 开 | 他 1 为 大 于 于 的 最 小 情 
6 KP- 乓 iL I 攻 ， 磷 址 并; 
了 Teturn PPxtractegd 

b. 证 明 由 OFE-LINE-MINIMUM 返回 的 数组 extracted 是 正确 的 。 

c. 说 明 恕 何 用 分 离 集 合 数据 结构 来 有 效 地 实现 OFF--LINE-MINIMUM。 另 给 出 该 实 
现 的 最 坏 情 况 迹 行 时 间 的 一 个 紧 确 的 界 。 


22-2 深度 确定 


企 谋 度 确定 问题 中 ， 我 们 对 以 下 码 个 操作 所 作用 的 一 个 有 根 的 森林 上 = fT} 加 以 维护 : 
MAKE--TREEIV): 创建 一 棵 包含 唯 一 节点 v 的 树 FIND-DEPTHOv): 返回 节点 v 在 
树 中 的 深度 
GRAFTLr，W: 使 节点 了 (假定 为 革 栋 树 的 根 ) 成 为 节点 v 前 子 节点 【假定 节点 v 在 
娘 一 探 人 怪 中 ， 筷 本身 可 能 基 也 可 能 不 是 个 根 ) 
8 假设 我 们 采用 的 是 类 似 于 分 离 集合 森林 的 树 表 示 : P[e] 为 节点 y 的 父亲 : 如 果 v 是 根 的 
话 ，pfvj= v。 如 果 我 们 通过 禹 prj<-v 来 实现 GRAFT(r，Y)， 通 过 洪 寻 找 路 径 上 升 
鞋 根 并 返回 所 迪 到 的 非 v 节点 个 数 来 实现 FIND-DEPTH(w) ， 证 明 一 个 包含 m 次 
FEIND-PEPTH 和 右 RARFT 操作 的 序列 的 最 坏 捕 况 运 行 时 间 为 Btm”) 。 
通过 采用 按 秩 合 六 和 路 径 压 缩 启 发 式 ， 订 以 减少 最 坏 情 况 运行 时 间 。 我 们 采用 分 离 集合 
杂 林 S= 1Sj， 其 中 每 个 集合 中 【 它 李 身 是 棵 树 ) 刁 森 林 上 中 的 - - 棵 树 Ti 对 应 。 然 而 ， 集 合 
S 中 的 树 结构 并 不 一 定 与 Ti 的 结构 对 应 。 实际 上 ，S8i 的 实现 并 设 有 记录 准 奖 的 父 - 子 关系 ， 
但 它 使 得 我 们 可 以 确定 Ti 中 任意 节点 的 深度 。 
这 种 表示 的 主要 思想 就 是 在 每 个 节点 v 中 记录 一 个 “ 仿 让 离 "dv], 它 定义 成 使 集合 $ 中 
沿 从 v 至 根 的 路 从 上 所 有 的 伤 臣 离 之 和 等 于 v 在 卫 中 的 深度 。 也 就 是 说 , 如 果 &S 中 从 至 
根 的 路 径 为 ww vi, …, we 此 处 mw=v 县 w 为 $ 的 根 ， 则 v 在 定 中 的 深度 为 ,dfvl. 


b. 给 出 MAKE-TRREE 的 一 种 实现 ， 

c、 说 明 如 何 收 改 FIND--SET 以 实现 FIND-PEPIH。 所 给 出 的 实现 诬 做 路 径 压 继 ， 且 
其 运行 时 间 度 与 寻找 路 径 长 度 成 线性 关系 。 要 保证 该 实现 能 正确 地 更 新 仿 距 离 . 

4. 说 明 如 何 修改 UNION 和 LINK 过 程 以 实现 GRAFTUE，v， 它 合并 分 别 包含 r 和 v 的 集 
合 。 要 确保 所 给 出 实现 能 正确 地 更 新 伪 距 离 。 注 意 基 一 集合 $ 的 根 不 必 为 对 应 的 树 
T; 的 根 。 

e. 给 出 一 个 包含 mm 个 MAKE--TREE、FIND--DEPTH 和 GRAFT 操作 (其 中 0 个 是 
MAKE-TREE 操作 ) 的 序列 的 最 坏 情 况 和 运行 时 间 的 一 个 紧 确 的 恰 。 


”22--3 Tarian 的 脱 机 里 小 公共 祖先 算法 
在 一 棵 有 报 树 下 中 ， 两 个 节点 班 和 YY 的 最 小 公共 祖先 为 这 样 的 一 个 节点 w， 它 是 au 和 Y 
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的 相 先 ， 并 号 在 从 下 中 具有 最 大 深度 。 在 脱 机 最 小 公共 祖先 问题 中 ， 给 定 的 是 一 棵 有 根 树 
T 和 -- 个 由 工 中 节点 的 无 序 对 构成 的 任意 集合 P= {f(u，v) }， 我 们 希望 确定 P 中 每 个 对 的 
最 小 公共 祖先 。 

为 解决 腊 机 最 小 公共 祖先 问题 ， 下 面 的 过 程 以 调用 LCA(root[TD) 对 树 了 进行 遍历 。 在 
饥 房 前 ， 俱 定 每 个 节点 都 有 颜色 WHITE， 


蕊 生态 (0) 
1 刘 A 攻 ESETIU) 

2 aficestofr[EIND-SETIul ]=-u 

3 for 工 中 心 的 得 个 于 节 上 Y 

太 To 工人 凡 (v) 

5 UNIONCu，V) 

在 anccstor[FIND-SETLU -mu 
?了 eofoff 同 -< 一 有 LA 其 

8 for 每 个 符合 则 ，Y CEP 的 

咏 to 下 eolof [时下 0 和 CC 区 

人 


] then PrinteThe least comtriot anmcestor gf “and” vis”anceatorIFINdD SETIv] ] 


a. 证 明 ; 对 每 个 对 各 ，vj 7 P， 第 10 行 怡 执行 一 次 . 

b. 证 明 : 在 调用 LCAfu) 时 、 分 离 集合 数据 结 梅 中药 集 侣 等 于 u 在 树 工 中 的 深度 . 
ec 证明: 对 每 一 对 fu，v}EP，LCA 能 正确 地 显示 出 4 上 和 *v 的 最 小 公共 祖先 。 

4 假定 采用 22.3 节 中 的 分 离 集合 数据 结构 的 实 更， 分 析 LCA 的 运行 时 间 。 


练习 一 十 二 


22.i-1 候 设 CONNECTFED--COMPONENTS 作用 计 一 个 无 庙 图 G=(VY， 忆 )， 此 处 V={a，b. 5， 
de 站 多 hi ki 且 以 如 于 供 序 对 下 的 边 迁 行 处 理 : (， 间 ，( 作 下， 雪 ，，({b，g)，(a， 匡 
G， 入 ， 忆 ，k) ，(b， 太 、 司 ， 竹 ， 人 二 访 ，(a，e，(0，d 员 请 列 出 在 每 次 执行 第 3-5 行 各 连通 子 图 中 的 节 

22.1~2 证 明 : 在 CONNECTED-COMPONENTS 处 理 了 所 有 的 边 后 ， 两 个 质点 在 同一 连通 了 图 中 
当 具 仅 当 它们 在 同一 集合 中 。 

22.1-3 在 CONNECTEP-COMPONENTS 作用 二 一 个 包含 K 个 连通 子 图 的 无 向 图 的 过 程 中 ， 要 调 
用 FIND-ASRT 多 少 次 ? 要 调用 UNION 多 少 次 ? 用 IVI，IEI 和 基 来 表达 答案 。 


22.2-1 请 窟 出 MAKE-SET、FIND-SET 和 UNION 的 采用 链表 表示 和 加 权 侣 并 和 启 发 式 的 伪 代 码 。 
假定 舒 个 对 象 有 若干 个 属性 ， 其 中 repf 台 指 南 包含 x 的 集合 的 代表 ，last[x] 指 向 包含 x 的 人 链 袁 中 的 最 后 一 
个 对 象 ，size[x 给 出 了 包含 X 的 集合 的 大 小 。 所 给 出 的 伪 代 码 可 以 休 定 仅 当 x 是 个 代表 时 last[x] 和 sizefx] 是 
让 确 的 . 
22.2-2 请 给 出 下 而 的 程序 中 执行 FIND--SET 操作 后 的 数据 结构 及 返回 的 管 案 。 采用 带 加 权 合 并 中 发 
式 的 链 考 者 示 ， 
T for 和 -1 者 
2 ”do MA 了 其 E-SET(xi) 
3 gef is to 15 by 之 
二 do UNIONON，x) 
5 for is-l to 13 by 站 
和 do UNIONGOG， 辐 
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7_ UNION(Cxi，x0) 
8 UNION ，XI1 攻 . 
9 _ UNION ，xin) ， 
10 FIND-SET(x2) 
1 FIND-SETGo) 
22.2-3 定理 22.1 的 基础 是 在 采用 了 链表 表示 和 加 权 合 并 启发 式 后 对 MAKE-SET 和 FIND-SET 有 
平 排 时 间 界 DJ， 对 UNION 有 界 OIClgn)， 请 对 此 加 以 论证 。 
22.2-4 人 改 定 采 用 了 链表 表示 和 加 权 合 并 启发 式 ， 图 22,3 中 的 m 个 操作 需 更 Oo 的 时 间 , 且 
n 一 my 2lI+1， 9q=m 一 na。 请 给 出 该 抬 作 序 殉 运 行 时 间 的 紧 确 新 近 界 。 


22.3~1 用 带 按 秩 合并 上 村 路 种 压缩 启发 式 的 分 坎 集 合 森 林 来 做 练习 22.2-2。 

22.3-2 写 一 个 FIND-SET 的 带路 径 压 给 的 非 递 归 版 本 ， 

22,3 一 3 + 十 请 给 出 一 个 包 合 喇 个 MAKE-SET、UNION 和 FIND-SET 操作 的 序列 【其 中 n 个 是 
MAKE-SET 操作 )， 使 得 当 采 用 按 秩 合 并 时 的 时 了 间 代 价 为 Domn ig mn)。 

22.3-4 + ”证 明 : 在 采用 了 控 秩 合并 和 路 各 压缩 时 任意 一 个 包含 虽 个 MAKE-SET、FIND-SET 利 
UNION 揉 作 前 序列 〈 其 中 所 有 UNION 操作 出 现 寺 FIND--SET 操作 之 前 ) 需要 Otm)j 的 时 间 。 在 同样 
情 混 下 如 果 公 用 处 径 压 缩 启 发 式 呢 ? 


22.4--1 证 明 避 理 22.2。 

22.4-2 对 每 个 节点 x， 为 存储 size(x) 共和 需 多 少 位 ? 要 存 情 rank[x] 入 怎样 呢 ? 

22.4-3 利用 让 理 22.2 和 推论 22.5， 证 中 作 开 于 一 个 带 按 秩 合 并 但 不 带路 径 压 缩 的 分 离 集合 森林 渍 的 
操作 的 运行 时 间 为 O(m lg nm)， 

22.4-4 * ”条 设 我 们 对 收费 的 规则 加 以 楚 改 ， 使 得 对 j 一 0，1，…， 1] “nm1I， 对 可 找 路 径 上 秩 在 让 j 
中 的 最 后 一 个 节点 收取 一 裕 块 费 用 。 理 则 ， 对 该 节点 收 阴 一 次 路 径 费 轧 。 这 样 ， 如 果 某 一 节点 是 很 的 芒 
子 ， 并 且 不 是 一 个 献 中 的 最 后 一 个 节点 ， 就 对 它 收 取 一 次 路 径 费 用 ， 而 不 是 块 费用 。 证 明 兴 一 个 给 定 的 节 
点 的 秩 在 一 给 定 的 块 中 时 ， 对 它 可 收取 Qtm) 次 路 径 费 用 。 
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第 六 篇 图 的 算法 


辆 是 计算 机 科学 中 常用 的 一 种 数据 结构 ， 有 关 图 的 算法 也 很 多 。 本 章 将 涉及 一 些 与 图 有 
关 的 难题 解法 。 

在 第 二 十 三 章 中 ， 我 们 主要 讨论 如 何在 计算 机 上 描述 图 以 及 以 此 为 基础 的 宽度 优先 搜索 
和 深度 优先 搜索 算法 。 我 们 同时 给 出 了 应 用 深度 优先 搜索 的 两 个 实例 ; 即 有 向 无 回路 图 的 拓 
扑 排序 和 和 把 一 个 有 回 图 分 解 为 相应 的 强 连 通 了 于 络 .。 

第 二 十 四 童 主要 论述 如 何 生成 一 个 图 的 最 小 权 生 成 树 。 我 们 定义 这 样 的 生成 树 为 : 当 图 
的 每 边 都 有 其 相应 的 权 值 时 联结 所 有 顶点 的 最 小 权 值 路 径 。 计 算 最 小 生成 树 的 算法 是 贪心 算 
法 〈 详 见 第 十 七 章 ) 的 一 个 很 好 的 实例 。 

第 二 十 五 章 和 第 二 十 六 章 主要 讨论 赋 权 图 中 项 点 间 最 短路 径 的 计算 问题 。 第 二 十 五 章 介 
绍 了 计算 从 给 定 顶 点 到 图 的 其 他 顶点 的 最 短路 径 的 算法 ， 第 二 十 六 章 介绍 了 计算 圈 中 每 一 对 
顶点 间 最 短路 径 的 算法 。 

最 后 ， 在 第 一 十 七 章 中 ， 我 们 主要 介绍 在 具有 指定 源 和 汇 ， 以 及 指定 容量 (一 条 有 疝 迪 
的 容量 可 以 看 作 某 种 特定 物质 沿 这 条 边 输送 的 最 大 数量 ) 的 网 络 中 最 天 流 的 计算 问题 ， 这 燃 
疝 络 问题 常 以 多 种 形式 出 更 ， 掌 握 计 算 最 大 流 的 一 种 好 的 算法 对 于 解决 各 种 各 样 的 相关 问题 
将 是 非常 有 益 的 ， 

给 定 一 个 图 台 = (V，E)， 在 描述 其 相应 算 法 的 运行 时 间 时 ， 我 们 通常 根据 图 的 顶点 数 
IVI、 边 数 |B 求 确定 输 人 的 规 横 ， 就 是 说 在 描述 输 人 规 寞 的 大 小 时 有 了 两 个 而 不 是 一 个 相关 的 
- 参数 。 对 这 些 参 数 我 们 采用 通常 的 约定 记 法 。 在 渐 近 记 法 〈 例 如 一 记号 或 名 -记号 ) 也 仅 
在 该 记号 中 ， 符 号 Y 表示 |WI，BE 表示 |EI。 例 如 ， 如 果 我 们 说 :“ 某 个 算法 的 运行 时 间 为 
OI(VE"， 意 昧 着 该 算法 的 运行 时 间 为 OUVIIBEl)。 这 种 约定 使 得 运行 时 间 公 式 妇 简单 易 读 ， 
又 不 会 产生 歧义 。 

在 仿 代 狗 中 我 们 采用 了 另外 一 种 约定 。 我 们 用 VIG] 和 和 EIG] 分 别 表示 图 G 的 镍 点 集合 和 
边 的 集合 ， 即 在 伪 代 码 中 ， 我 们 把 顶点 集 和 和 边 集 作 为 图 的 属性 . 
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第 二 十 三 章 ”图 的 基本 算法 


本 章 着 重 阐述 图 的 表示 方法 和 图 的 搜索 方法 。 搜 索 一 个 图 就 是 以 一 种 系统 的 方式 沼 着 图 
的 边 访问 所 有 的 顶点 。 图 的 搜索 算法 可 以 使 我 们 发 现 图 的 很 多 结 雹 信息 .许多 有 关 图 的 算法 
开始 都 通过 搜索 输入 图 来 获取 结构 信息 。 另 外 还 有 一些 图 的 算法 实际 上 是 由 基本 的 搜索 算法 
既 过 简单 扩充 而 成 。 国 此 ， 图 的 搜索 技术 是 图 的 算法 领域 的 核心 。 

第 23.1 节 讨 论 了 图 的 两 种 最 善 壳 的 计算 机 表示 法 : 邻接 表 和 俩 接 怎 阵 ， 第 23.2 节 介 绍 
了 一 种 简便 的 称 为 宽度 优先 的 图 的 搜索 算法 ， 并 展示 如 何 建立 一 个 图 的 宽度 优先 树 。 第 
23.3 节 介 绍 了 深度 优先 搜索 算法 ， 并 证 明了 一 些 根据 深度 优先 搜索 访问 项 点 次 序 的 标准 结 
论 。 第 23.4 节 为 我 们 提供 了 应 用 深度 优先 搜索 的 第 一 个 实例 : 有 向 无 问 路 图 的 拓扑 排序 。 
应 用 深 度 优 先 搜索 的 另 一 个 实例 : 把 有 侣 图 分 解 为 其 强 连通 子 图 ， 将 在 第 23.5 节 中 讨论 ， 


23.1 图 的 表示 


要 表示 一 个 图 G=(V，E)， 有 两 种 标准 的 方法 ， 即 邻接 表 和 邻接 矩阵 。 通 常 采用 邻接 
表 ， 因 为 用 这 种 方法 表示 右 蔓 图 (图 中 | 了 远 小 于 |V 门 比较 简洁 紧 凌 。 本 书 中 大 部 分 图 的 算法 
都 假定 输入 图 的 存储 结构 是 邻接 表 形 式 。 但 是 当 遇 到 稠密 图 (El 接近 |V 门 或 必须 很 快 判 别 两 
个 给 定 顶 点 是 否 相 邻 时 ， 通 常 采用 邻接 矩阵 表示 法 。 例 如 ， 第 - -十 六 章 中 讨论 的 两 种 每 对 项 
点 间 最 短路 径 算 法 中 输入 图 就 采用 了 邻接 条 阵 表示 法 。 


1 





(c) 
锥 23.1 无 向 国 的 两 种 表 永 法 


图 G= (V，B) 的 邻接 表 表 示 由 数组 Adj 构成 ， 数 组 元 素 为 顶点 ， 每 一 个 顶点 对 应 一个 
邻接 表 。 对 每 一 个 顶点 uCV， 邻 接 表 Adjfuj 包 含 (指向 ) 所 有 满足 条 件 (0，V)《 巨 的 顶点 v， 
即 Adjtu] 包 含 图 G 中 所 有 和 顶点 u 相 邻 接 的 顶点 ， 在 每 个 邻接 表 中 的 顶点 按 任 意 次 序 存 
储 。 图 23.1 示 出 了 无 向 图 的 两 种 表示 法 : (a) 具有 五 个 结 点 和 七 条 边 的 无 向 图 G。(b) G 
的 邻接 表 表 示 。{(c) G 的 邻接 抢 阵 表示 。 类 似 地 , 图 23.2 示 出 了 有 问 图 的 丙种 表示 法 ， 
(a) 具有 六 个 结 点 和 八条 边 的 有 向 图 G。 (b) G 的 邻接 表 表 未。 (c) G 的 俩 接 矩 阵 表示 。 
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区 





(9 人 ) . (ec 
中 23.2 有 向 图 的 两 种 表示 法 


车 避 是 有 向 图 ， 那 么 所 有 邻接 表 的 长 度 和 应 为 |B， 因 为 对 于 任意 边 (a，v)， 顶 点 Y 都 
内 现在 顶点 的 邻接 表 Adjid 中 。 著 G 是 无 向 图 ， 那 么 所 有 邻接 表 的 长 度 之 和 应 为 ?|E|， 
因为 若 (u，j 是 -条 无 癌 边 ， 那 么 顶点 一 定 出 现在 v 的 邻接 表 中 , 反之 亦 然 。 不 论 是 有 向 
团 还 是 无 向 图 ， 邻 接 表 表示 法 都 有 一 个 吸引 人 的 特点 ， 即 它 需要 的 存储 容量 为 O(max(V， 
Ej)= OO(CVTEE)， 

信 接 表 方 式 稍 作 变动 就 可 用 来 表示 加 权 图 。 即 每 边 都 有 相应 权 值 的 图 ， 权 值 通常 由 加 权 
函数 w: ER 确定 。 例 如 : 设 G={(V，B) 是 一 个 加 权 函 数 为 w 的 加 权 图 ， 对 每 一 条 边 (u， 
VCE， 权 值 wu， 思 和 顶点 Y 一 起 存储 在 _ 的 邻接 表 中 。 对 邻接 表 表 示 法 稍 作 修改 就 能 支 
持 坚 的 其 他 的 变 体 、 具 有 很 强 的 适应 性 。 

都 接 表 也 有 潜在 的 不 是 之 处 ， 如 要 确定 边 人 n，v) 是 否 存 在 ， 只 能 在 顶点 立 的 邻接 表 
Adqjfu] 中 搜索 v 而 没有 其 他 更 快 的 方法 。 这 一 不 足 可 以 通过 图 的 邻接 矩 秩 表示 法 来 弥补 , 但 
要 以 占用 更 多 的 存储 空间 为 代价 。 

在 图 G=(VY，E) 的 邻接 答 阵 表示 法 中 ， 我 们 假定 按 任 意 某 种 方式 对 其 顶点 编号 为 1， 

，|Vl， 那 么 G 的 邻接 惩 阵 为 一 个 |VIxIYI 引 阵 A= (aij， 且 满足 
1 落 人 1，jhEE 
mu 一 t0 否则 
一 个 图 的 促 接 矩阵 需要 占用 B(V2 的 存储 容量 ， 和 其 边 数 无 关 。 
观察 -- 下 图 23.1(c)， 该 邻接 手 阵 沿 主 对 角 线 对 称 。 我 们 定义 复 阵 A(a, ) 的 转 痢 矩阵 


为 A = (ai)， 其 中 ai = ai。 因 为 在 无 向 图 中 ，(n，v) 和 (v， 站 表示 同一 条 边 ， 因 此 无 向 


图 的 邻接 矩阵 A 的 转 置 矩 阵 就 是 A:A = A_ 。 在 一 些 弃 用 中 ， 可 以 只 存储 邻接 矩阵 对 角 线 以 
上 的 部 分 ， 这 样 一 来 图 所 占用 的 存储 空间 几乎 可 以 减少 一 半 ， 采 用 这 种 存储 方法 是 很 有 益 
的 。 

企 如 邻接 表 一 样 ， 邻 接 怎 阵 也 可 以 用 来 表示 加 权 图 。 例 如 ， 如 果 台 =(V，B) 是 一 个 加 
权 此 ， 权 值 函数 为 mw， 对 于 (u， 习 上 了， 其 权 值 wu，v) 就 可 简单 地 存储 在 邻接 下 阵 的 第 
行 、 第 v 列 的 元 素 中 ， 若 不 存在 这 样 一 条 边 ， 出 可 在 狂 阵 的 相应 元 素 中 赋值 NIL， 当 然 很 
多 问题 中 用 0 或 ce 更 方便 。 

虽然 邻接 表 表 示 法 和 邻接 矩阵 表示 法 一 样 有 效 ， 但 由 于 邻接 矩阵 简单 明了 。 因 此 当 图 形 
较 小 时 常用 邻接 第 阵 。 另 外 , 如 果 不 是 加 权 图 ， 采 用 邻接 矩阵 的 存储 形式 还 有 一 个 优越 性 : 
名 接 矩阵 可 以 只 用 一 位 而 不 必用 一 个 字 空 间 来 存储 每 一 个 矩阵 元 素 . 
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23.2 ”宽度 优先 搜索 


宽度 优先 搜索 算法 是 最 简便 的 图 的 搜索 算法 之 一 ， 这 一 算法 也 是 很 多 重要 的 疾 的 算法 的 
原型 。Dijkstra 单 源 章 短路 径 算法 (第 二 干 五 章 ) 和 Prim 最 小 生成 树 算 法 (第 24.2 节 ) 都 采用 了 
和 宽度 优先 搜索 类 似 的 思想 。 

已 知 图 怠 =(V， 革 和 一 个 源 顶 点 sS， 宽 度 优 先 搜索 以 一 种 系统 的 方式 探寻 局 的 边 ， 从 而 
“发 现 "s 所 能 到 达 的 所 有 顶点 ， 并 计算 s 到 所 有 这 些 顶 点 的 臣 高 (最 少 边 数 )， 该 算法 同时 能 
生成 一 棵 根 为 s 且 包 括 所 有 可 达 顶 点 的 宽度 优先 树 。 对 从 s 可 达 的 任意 顶点 v， 宽 度 优先 树 
中 从 ss 到 v 的 路 径 对 庶 于 图 台 中 从 s 到 v 的 最 短路 径 ，、 即 包含 最 小 边 数 的 路 从。 该 算法 对 
有 癌 图 和 无 向 图 同样 适用 ， 

之 所 以 称 之 为 宽度 优先 算法 ， 基因 为 算法 自始至终 一 宜 通 过 已 找到 和 未 找到 顶点 之 间 的 
边 愉 问 外 扩展 ， 就 是 说 ， 算 法 首先 搜索 和 s 申 离 为 k 的 所 有 顶点 ， 然 后 再 去 搜索 和 $ 曰 离 为 
k+1 的 其 他 顶点 。 

为 了 保持 搜索 的 轨迹 ， 宽 度 优先 搜索 为 每 个 顶点 着 色 : 白色 、 厌 色 或 黑色 。 算 法 开始 前 
所 有 顶点 都 是 日 色 ， 随 着 搜索 的 进行 ， 各 顶点 会 逐 疡 变 成 灰色 ， 然 后 成 为 黑色 。 在 搜索 中 第 
一 次 碰 到 一 顶点 时 ， 我 们 说 该 项 点 被 发 现 ， 此 时 该 顶点 变 为 非 和 白色 顶 上 点。 因此， 其 色 和 黑色 
顶点 都 已 被 发 现 ， 但 是 ， 宽 度 优 先 拉 索 算法 对 它们 加 以 区 分 以 保证 搜索 以 宽度 优先 的 方式 执 
行 。 若 (u， 妇 & 下 且 顶点 为 黑色 ， 那 么 顶点 vY 槛 人 么 是 灰色 ， 要 么 是 墨色， 就 是 说 ， 所 有 和 
黑色 顶点 邻接 的 顶点 都 已 被 发 现 。 上 其 色 顶 点 可 以 与 一 些 白 色 顶 点 相 邻 接 ， 它 们 代表 着 已 找到 
和 未 找到 顶点 之 间 的 边界 。 

在 宽度 优先 搜索 过 程 中 建立 了 一 栋 宽 度 优先 树 ， 起 始 时 只 包含 根 节点 ， 即 源 顶 点 s。 在 
扫 撞 已 发 现 预 点 u 的 邻接 表 的 过 程 中 每 发 现 一 个 白色 项 点 v， 该 顶点 及 边 改 ， 妇 就 被 滩 加 
到 树 中 。 在 宽度 优先 树 中 ， 我 们 称 结 点 习 是 结 点 y 的 先辈 或 父母 结 点 。 央 为 一 个 结 点 至 多 
只 能 被 发 现 一 人 次 ， 因 此 它 最 多 只 能 有 一 个 父母 结 点 。 相 对 根 结 点 来 说 祖先 和 后 裔 关系 的 定义 
和 通常 一 样 : 如 果 处 于 树 中 从 根 s 到 结 点 Y 的 路 径 中 ， 那 么 ua 称 为 v 的 祖先 ，v 是 翌 的 后 
-高 

十 面 的 宽度 优先 搜索 过 程 BFS 假定 输 人 图 G=(VY，B) 采 用 邻接 表 表 示 ， 对 于 图 中 的 每 
个 顶点 偿 采 用 了 玫 种 附加 的 数据 缚 构 ， 对 每 个 顶点 上 CEV， 其 色彩 存储 于 变量 color[u] 中 ， 
结 点 己 的 父母 存 于 变量 可 可 中 。 如 果 业 没有 父母 (例如 =s 或 u 还 没有 被 检索 到 )， 则 
fm]=NIL， 由 算法 算出 的 源 点 s 和 顶点 之 亲 的 距离 存 于 变量 d[u] 中 ， 算 法 中 使 用 了 一 个 
先进 先 出 队列 Q( 见 第 11.1 节 ) 来 存放 灰色 节点 集合 。 


BFSLG，S) 

1，for 吞 个 节点 uE V[IG]-fs} 
2 do “coler[uj 一 WHITE 
3 d[ulee 
4， f[u]<-NTL 
5 Coloris]<-G 尺 六 交 
丰 二 [s]* 全 
T. x[sl< NIL 


38， Qt 
9、 while 心 二 币 
10.。 do u<head[qQl 
11. for 每 个 节点 YE Adjfu] 


12. 和 人 详 eolotr[ 吕 三 WHITE 

13， then eolor[v]< 一 人 性 和 了 
14， dvl<d[v]+1i 

15， FF[ 吕 < 一 

] 三 ENQUEUEIQ，v 
1 了. DEQUEUEIG) 
18， color [W<-BLA 天 


图 23.3 展示 了 用 BEFS 在 例 图 上 的 搜索 进程 。 阴 影 绪 盖 的 边 是 由 BFS 产生 的 树枝 。 每 
个 结 氮 _u 内 叫 示 的 值 为 dl， 图 中 所 示 的 队列 QQ 是 第 9-18 行 while 循环 中 每 次 迭代 起 始 时 
的 队列 。 队 列 中 每 个 结 点 下 面 是 该 结 点 与 源 结 点 的 距离 。 











下 下 各 WE 世 
本 二 二 .- 史 、 
En 中 1 克 国 Tea 和 于 
oa 各 nn nn cd m 一 一 二 ae 
Te 人 7 
漠 发 > 胃 划 | 了 | 党 共 | 立 | 工 | 
可 时 3 到 于 于 血 
二 q 由 “ 他 
人 o 二 
而 ni [本 | 
轧 . 号 本 夏 
旺 上 上 旺 
人 昌 2 了 
草 二 ES 和 
二 下 二 -上 上 一半- 一 
本 | | 中 | zz |3| 1 六 ss 
3 Te 上 3 二 = EN zz 一 ， 一 
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j sa 吧 半 sa |] 员 可 衬 叶 
站 和 | 有 本 0 ce 
1 0 Le LT 
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可 呵 丁丁 证 吉 面 再 百 
人 二 

















图 23.3 BEFS 在 一 个 无 疝 贺 上 的 执行 过 程 “ 


过 程 BFS 按 如 下 方式 执行 ， 第 1-4 行 置 每 个 结 点 为 白色 ， 置 du 为 无 穷 大 ， 每 个 结 点 
的 父母 置 为 NIL， 第 5 行 喷 源 结 点 s 为 灰色 ， 即 意味 着 过 程 开始 时 源 结 点 已 被 发 现 , 第 6 行 
初始 化 [sj 为 0， 第 7 行 置 源 结 点 的 父母 结 点 为 NIL， 第 8 行 初始 化 队列 Q, 使 其 仅 含 源 结 
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点 s， 以 后 Q 队列 中 仅 包 含 其 色 结 点 的 集合 。 

程序 的 主 循环 在 9-18 行 中 ， 只 要 队列 Q 中 还 有 灰色 结 点 ， 即 那些 已 被 发 现 但 还 没有 完 ， 
全 搜索 其 邻接 表 的 结 点 ， 循 环 将 一 直 进 行 下 去 。 第 19 行 确定 队列 头 的 灰色 结 点 为 第 
1-16 行 的 循环 考察 u 的 邻接 表 中 的 每 一 个 顶点 "。 如 果 v 是 白色 结 点 ， 那 么 该 结 点 还 没有 
被 发 现 过 ， 算 法 通过 执行 第 13-16 行 发 现 该 结 点 。 首 先 它 被 置 为 训 色 ， 距 离 dIv] 轩 为 
du]+1， 而 后 _u 被 记 为 该 节点 的 父母 ， 最 后 它 被 放 在 队列 Q 的 队 尾 。 当 结 点 的 邻接 表 中 
的 所 有 结 点 都 被 检索 后 ， 第 17-18 行使 上 弹出 队列 并 器 成 黑色 . 


分 析 


在 证 明 宽 度 优 先 搜索 的 各 种 性 质 之 前 ， 我 们 先 做 一 些 相对 简单 的 工作 一 -分 析 算 法 在 图 
G=(V，B) 之 上 的 运行 时 间 。 在 初始 化 后 ， 再 没有 任何 结 点 又 被 苟 为 白色 。 因 此 第 12 行 的 
测试 保证 每 个 结 点 至 多 只 能 进入 队列 -- 次 ， 因 而 至 多 只 能 弹出 队列 一 次 。 人 队 和 出 附 操 作 镑 
要 OUD) 的 时 间 ， 因 此 队列 操作 所 占用 的 全 部 时 间 为 D(V)， 因 为 只 有 当 每 个 顶点 将 被 阐 出 陵 
列 时 才 会 查找 其 邻接 表 ， 因 此 每 个 顶点 的 邻接 表 硅 多 被 扫描 一 次 。 因 为 所 有 邻接 表 的 长 度 和 
为 @@(E)， 所 以 扫描 所 有 邻接 表 所 花费 的 全 部 时 间 至 多 为 O(E)。 初 始 化 操作 的 开销 为 
O(V)， 因 此 过 程 BFS 的 全 部 运行 时 间 为 O(V+E)， 由 此 可 见 ， 寅 度 优 先 搜索 的 运行 时 间 是 
图 的 邻接 表 大 小 的 一 个 线性 函数 ， 


最 短路 径 ， 


在 本 部 分 的 开始 ， 我 们 讲 过 ， 对 于 一 个 图 G=(VY，HB)， 宽 度 优 先 搜索 算法 可 以 得 到 从 
忆 知 源 结 点 sE V 到 每 个 可 达 结 点 的 匣 离 ， 我 们 定义 最 短路 径 长 度 8s， 人 为 从 顶点 s 到 项 后 
Y 的 路 径 中 具有 最 少 按 数 的 路 径 所 包含 的 边 数 ， 若 从 s 到 v 没有 通路 则 为 cc。 上 其 有 这 一 此 高 
5(s， 纪 的 路 径 即 为 从 s 到 v 的 最 短路 径 卫 ， 在 证 明 宽 度 优 先 搜 索 计 算出 的 就 是 最 短路 径 长 度 
前 ， 我 们 先 看 下 最 短路 径 长 度 的 一 个 重要 性 质 。 
引 理 23.1 设 台 =(V，BE) 是 一 个 有 向 图 或 无 向 图 ，sEY 为 台 的 任意 一 个 结 点 ， 则 对 人 尾 
意 边 (tt， 人 全 。 
5 ssGs，u+l 
证 明 : 如 果 从 顶点 s 可 达 顶 点 u， 则 从 s 也 可 达 v。 在 这 种 情况 下 从 s 到 v 的 最 短路 径 
不 可 能 比 从 sg 到 的 最 短路 径 加 上 边 和 ，y) 更 长 ， 因 此 不 等 式 成 立 ; 如 果 从 s 不 可 达 项 氮 
贴 Xs， 由 =ce， 不 等 式 仍 然 成 立 。 
我 们 试图 说 明 对 每 个 顶点 vEY，BFS 过 程 算 出 的 dlIv]= 5s，W, 下 面 我 们 首先 证 明 
div] 是 5(s， 信 的 上 界 。 
引 理 23.2 设 G=(V，BE) 是 一 个 有 向 或 无 向 图 ， 并 假设 算法 BFS 从 台中 一 已 知 源 结 点 
sf YV 开始 执行 ， 在 执行 终止 时 ， 对 每 个 顶点 YEV， 变 量 dfvj 的 值 满足 : di] 兰 只 5， 
证 阴 :; 我 们 对 一 个 顶点 进入 队列 Q 的 次 数 进行 归纳 ， 我 们 归纳 前 假设 在 所 有 项 点 VE 
V，d[y] 关 5fls，Vv) 成 立 。 


全 第 二 十 五 和 第 一 十 六 章 中 ， 我 们 将 把 最 短路 径 推广 到 赋 权 图 ， 其 中 每 边 都 月 一 个 实 型 的 梳 值 ， 一 茶 路 生 
-的 碎 是 组 成 该 路 径 所 有 壹 的 权 值 之 和 ， 目 前 讨论 的 图 都 不 是 赋 权 图 . 
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归纳 的 基础 是 BFS 过 程 第 8 行当 结 点 s 被 放 人 队列 昌 后 的 情形 ， 这 时 与 纳 假设 成 立 ， 
中 为 对 于 任意 结 点 YEYV-[sj, dsl]=0=5s， 且 d[yj= ce 关 is，)。 

然后 进行 归纳 ， 考 虑 从 顶点 立 开 始 的 搜索 中 发 现 一 白色 顶点 v， 按 归纳 假设 ，d[u] > 
5s，U)。 从 过 程 第 14 行 的 赋值 语句 以 及 引 理 23.1， 可 条 

qv]=draJ+i 
站 ss，DH1 
六 - 

然后 , 结 点 被 插 人 队列 Q 中 。 它 不 会 再 次 被 插 人 队列 ， 因 为 它 已 被 冒 为 灰色 ， 而 第 
13-16 行 的 then 子 句 列 只 对 白色 缚 点 进行 操作 ， 这 样 dv] 的 值 就 不 会 改变 ， 所 以 归纳 假设 
成 立 。( 证 毕 ) 

为 了 证 明 drYj= 5(sv， 首 先 我 们 必须 更 精确 地 展示 在 BES 执行 过 程 中 是 如 何 对 队列 进 
行 操作 的 ， 下 面 一 个 引 理 说 明 无 论 何 时 ， 队 列 中 的 结 点 至 多 有 两 个 不 同 的 d 值 。 

5 引 理 23.3 很 设 过 程 BFS 在 图 G=(V,BE) 之 上 的 执行 过 程 中 ， 队 列 加 包含 如 下 结 点 
<Yyb va Vi>， 其 中 是 队列 中 的 头 ，v 是 队列 的 尾 ， 则 d[v 和 d[v]+1 且 dv]< 
d[v 1]，i= 1,2,……r 一 1 。 

证 明 : 证 明 过 程 是 对 队列 操作 的 次 数 进 行 归纳 。 初 始 时 ， 队 列 仅 包含 顶点 s， 引 理 自然 
于 痛 。 

下 面 进 行 归 纳 ， 我 们 必须 证 明 在 压 人 和 弹出 一 个 顶点 后 引 理 仍 然 成 立 。 如 果 队 列 的 头 w 
被 弹出 队列 ， 新 的 共 头 为 wa( 如 果 此 时 队列 为 空 ， 引 理 无 疑 成 立 )， 所 以 有 dfw]<d[y]+1l< 
d[vz]+1， 余 下 的 不 等 式 依 然 成 立 ， 因 此 v: 为 队 头 时 引 理 成 立 。 要 揪 人 一 个 结 点 人 队列 需 仔 
纸 分 析 过 程 BFS， 在 BFS 的 第 16 行 ， 当 顶点 Y 加 和 人 队列 成 为 v,, 时 ， 队 列 头 w 实际 上 就 
是 正在 反 撒 其 邻接 妻 的 顶点 u， 因 此 有 d[w.]=d[vl= dulj+l= dfv]t+1， 这 时 同样 有 dv 所 
dlyij+li=dra+l=dv=d[v ai]， 余 下 的 不 等 式 dtv]s 和 dv] 仍然 成 立 ， 因 此 当 结 点 v 揪 和 人 队 
列 时 引 理 同 样 正确 。 

现在 我 们 可 以 证 明 宽度 优先 搜索 算法 能 够 正确 地 计算 出 最 短路 径 长 度 . 

定理 23.4( 宽 度 优先 搜索 的 正确 性 ) 设 G=(V,E) 是 一 个 有 向 图 或 无 向 图 ， 并 假设 过 程 
BFS 从 G 上 某 顶 点 sSEV 开始 运行 ， 则 在 执行 过 程 中 ，BFS 可 以 发 现 源 结 点 s 可 达 的 每 一 
个 结 氮 YEVY， 在 运行 终止 时 ， 对 任意 YE V，dIv]= 5sy) 此 外 ， 对 任意 从 s 可 达 的 节点 v 志 
s， 从 $ 到 的 最 短路 径 之 一 是 从 s 到 xy] 的 最 短路 径 再 加 上 边 fr[v],w。 

证 明 : 我 们 先 证 明 结 点 v 是 从 s 不 可 达 的 情形 。 由 引 理 23.2，d[yj> its =ce， 根 据 过 
程 第 14 行 ， 顶 点 Y 不 可 能 有 一 个 有 限 的 dfy] 值 ， 由 归纳 可 知 ， 不 下 能 有 满足 于 列 条 件 的 第 
一 个 顶点 存在 : 该 顶点 前 d 值 被 过 程 的 第 14 行 语 句 置 为 co， 因此 仅 对 有 有 限 d 值 的 人 顶点， 
第 14 行 请 名 才 会 被 执行 。 因 此 若 v 是 不 可 达 的 话 ， 它 将 不 会 在 搜索 中 被 发 现 . 

证 明 主 要 是 对 由 s 可 达 的 顶点 来 说 的 。 设 凡 表示 和 s 臣 离 为 的 顶点 集合 ， 即 V = fy 
4V: 5s = 区 }。 证 明 过 程 为 对 政 进行 归纳 。 作 为 归纳 假设 ， 我 们 假定 对 于 每 一 个 顶点 TY 
《Vx， 在 BFS 的 执行 中 只 有 某 一 特定 时 刻 满 足 : 

- 结 点 v 为 不 色 | 
dv] 被 置 为 二 
-如果 vs， 则 对 于 某 个 uk Vi，xr[v] 被 置 为 也 
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“TY 被 揪 人 队列 马 中 。 

正如 我 们 先前 所 述 ， 至 多 只 有 一 个 特定 时 刻 满足 上 述 条 件 。 

归纳 的 初始 倩 形 为 k= 0， 此 时 Vi= fsj， 因 为 显然 源 结 点 。 是 叭 和。 距离 为 0 的 绪 
点 ， 在 初始 化 过 程 中 ，s 被 置 为 庆 色 ，dis] 被 置 为 0， 且 s 被 放 人 队列 Q 中 ， 所 以 归纳 假设 成 
记 。 

下 面 进 行 归 纳 ， 我 们 须 注意 除非 到 算法 终止 ， 队 列 Q 不 为 宅 ， 而 且 - 一 旦 某 结 点 理 被 捅 
入 队列 ，digd 和 xfu] 都 不 再 改变 。 根 据 引 理 23.3， 可 知 如 果 在 算法 过 程 中 结 点 按 次 序 wwvv 
被 插入 队列 ， 那 么 相应 的 距离 序列 是 单调 递增 的 : d[v] 和 dlv]，i= 12,…:r1， 

现在 我 们 考虑 任意 结 点 vE Vk，kz 1。 根 据 单调 性 和 d[yj>k( 由 引 理 23.3 和 归纳 候 
设 ， 可 知 如 果 v 能 够 被 发 现 , 出 必 在 V&_, 中 的 所 有 结 点 进入 队列 之 后 。 

由 gsw=k， 可 知 从 s 到 v 有 一 条 具有 上 边 的 通路 ， 因 此 必 存 在 某 结 点 uEV，, 且 (o) 
ECE。 不 失 一 般 性 ， 设 u 是 满足 条 件 的 第 一 个 灰色 结 点 (根据 归纳 可 知 集合 Vx_, 中 的 所 有 结 
点 都 被 置 为 藉 色 )，BFS 把 每 一 个 灰色 结 点 族人 队列 中 ， 这 样 由 第 10 行 可 知 结 点 咱 最 终 必 
然 会 作为 队 头 出 现 。 当 1 成 为 队 头 时 ， 它 的 邻接 表 将 被 打 措 就 会 发 现 结 点 v( 结 点 v 不 可 能 
在 此 之 前 被 发 现 ， 因 为 它 不 与 V6<k=-D 中 的 任何 结 点 相 邻 接 ， 和 否则 v 不 可 能 属于 Vi， 并 
且 根 据 假 定 ，u 是 和 v 相 邻 接 的 Vi 中 被 发 现 的 第 一 个 结 点 )。 第 13 行 置 * 为 灰色 ， 第 14 
行 置 dvj=dtu+l=k， 第 15 行 置 fw] 为 u， 第 16 行 把 v 揪 人 队列 中 。 由 于 v 是 V, 中 的 任 
意 结 点 ， 因 此 证 明 归 纳 假设 成 立 . 

在 结束 定理 的 证 明 前 ,我 们 注意 到 如 果 vE V,， 则 据 我 们 所 知 训 得 x[v]E V，， 这 样 我 
们 就 得 到 了 一 条 从 s 到 v 的 最 短路 径 : 即 为 从 s 到 rx[w] 的 最 短路 径 再 通过 边 (zx[vjw)。 


宽度 优先 本 


过 程 BEFS 在 搜索 图 的 同时 建立 了 一 棵 宽度 优先 树 ， 如 图 23.3 所 示 ， 这 樟树 是 由 每 个 结 
点 的 垃 域 所 表示 。 我 们 正式 定义 先辈 子 图 如 下 ， 对 于 图 G=(V,E)， 源 顶点 为 sS， 其 先 浊 子 
本 避 ， ，E,) 满 足 : 

一 1yEYV: NIDU 人 
且 
={f(r[v] CEE: YE va 

如 果 V,。 由 从 s 可 达 的 顶点 构成 ， 那 么 先 音 子 图 G,, 是 一 棵 宽度 优先 树 ， 并 且 对 于 所 有 Y 
kV.Ga 中 唯一 的 由 s 到 Y 的 简单 路 径 也 同样 是 台中 从 s 到 Yv 的 一 条 最 短路 径 。 由 于 它 互相 
连通 ， 上 且 |E,|=|Y .| 一 1 见 定 理 $5.2)， 所 以 宽度 优先 树 事实 上 就 是 一 棵 树 ， 了 ， 中 的 边 称 为 树 
校 。 

当 BFS S 从 图 G 的 源 结 点 8 开始 执行 后 ， 下 面 的 引 理 说 明 先 毕 子 图 是 一 一 棵 宽度 优先 树 。 

引 理 23.$ ” 当 过 程 BFS 应 用 于 某 一 有 加 或 无 向 图 台 =(V,E) 时 ， 该 过 程 同时 建立 的 域 
满足 条 件 ; 其 先辈 子 图 台 ,= (VE ) 是 一 棵 宽度 优先 树 . 

证 明 过 程 BFS 的 第 15 行 语 杀 对 (uvEE 旦 5sw<ec( 即 v 从 s 可 太 ) 罗 rrvJj=ua， 因 
此 V, 基 由 六 中 从 v 可 达 的 顶点 所 组 成 ， 由 于 蝇 , 形成 一 棵 树 ， 所 以 它 包 售 从 ss 到 V。 中 每 一 
结 点 的 唯一 路 径 ， 由 定理 23.4 进行 归纳 ， 我 们 可 知 其 每 条 路 径 孝 是 一 条 最 短路 径 。 (证 毕 ) 

下 面 的 过 程 将 打印 世人 有 从 s 到 v 的 最 短路 径 上 的 所 有 结 点 ， 假 定 已 经 运行 完 BES 并 得 出 
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了 最 短路 径 树 ， 
PRINT-PATH(G,sw) 
1 这 vv 一 
了 tbhen trint S 
了 else 认 rr[v]=NIL 
才 then frint “no path frotmm ss to"V“exists” 
5 else PRINT 一 PATHIGs,r[v]) 
看 Print Y 
因为 每 次 递归 调用 的 路 径 都 比 前 一 次 调用 少 一 个 顶点 ， 所 以 该 进程 的 运行 时 间 是 关于 打 
印 路 径 上 顶点 数 的 一 个 线性 函数 。 


23.3 ”深度 优先 搜索 


正如 算法 名 称 那 样 ， 深 度 优先 搜索 所 遵循 的 搜索 策略 是 尽 可 能 “ 深 " 地 搜索 图 。 在 深度 优 
先 搜索 中 ， 对 于 最 新 发 现 的 顶点 ， 如 果 它 还 有 以 此 为 起 点 而 未 探测 到 的 边 ， 就 沿 此 边 多 续 探 
测 下 去 。 当 结 点 v 的 所 有 边 都 已 被 探寻 过 ， 搜 索 将 回 畦 到 发 现 结 点 v 有 那 条 边 的 始 结 点 。 这 
一 过 程 一 直 进 行 到 已 发 现 从 源 结 点 可 达 的 所 有 结 点 为 止 。 如 果 还 存在 未 被 发 现 的 结 点 ， 则 选 
择 其 中 一 个 作为 源 结 点 并 重复 以 上 过 程 ， 整 个 进程 反复 进行 直到 所 有 结 点 都 被 发 现 为 止 。 

和 宽度 优先 搜索 类 似 ， 等 当 扫 描 已 发 现 结 点 的 邻接 表 从 而 发 现 新 结 点 v 时 ， 深 度 优 
先 搜索 将 置 v 的 先辈 域 r[w] 为 u。 和 宽度 优先 搜索 不 同 的 是 ， 前 者 的 先辈 子 图 形成 一 棵 树 ， 
而 后 者 产生 的 先辈 子 图 可 以 由 史 棵 树 组 成 ， 因 为 搜索 可 能 由 多 个 源 顶点 开始 重复 进行 。 因 此 
深度 优先 搜索 的 先辈 子 图 的 定义 也 和 宽度 优先 搜索 稍 有 不 同 : G:=(Y,EJ，E.={ziww: v 
《V 且 xivjNIE} 深 度 优先 搜索 的 先辈 子 图 形成 一 个 由 数 个 深度 优先 树 组 成 的 深度 优先 森 
林 。E,。 中 的 边 称 为 树枝 。 

和 宽度 优先 搜索 类 亿 ， 在 搜索 过 程 中 也 为 结 点 着 色 以 表示 结 点 的 状态 。 每 个 顶点 开始 均 
为 白色 ， 搜 索 中 被 发 现时 置 为 灰色 ， 结 束 时 又 被 置 成 黑色 ( 即 当 其 邻接 表 被 完全 检索 之 后 )。 
这 一 技巧 可 以 保证 每 一 顶点 搜索 结束 时 只 存在 于 一 标 深 度 优先 树 上 ， 因 此 这 些 树 都 是 分 离 
的 。 

除了 创建 一 个 深度 优先 森林 外 ， 深 度 优 先 搜索 同时 为 每 个 结 点 加 盖 时 间 蕉 。 每 个 结 点 v 
有 两 个 时 间 和 发: 当 结 点 v 第 一 次 被 发 现 ( 并 置 成 灰色 ) 时 记录 下 第 一 个 时 间 稚 dlvw]， 当 结束 检 
查 v 的 邻接 表 时 (并 置 y 为 黑色 ) 记 录 下 第 二 个 时 间 惟 flv， 许多 图 的 算法 中 都 用 到 时 间 竹 ， 
他 们 对 推算 深度 优先 搜索 进行 情况 是 很 有 帮助 的 . 

下 列 过 程 DFS 记录 了 何 时 在 变量 d[u] 中 发 现 结 点 u 以 及 何 时 在 变量 fn] 中 完成 对 结 点 
的 检索 。 这 些 时 间 惟 为 1 到 2fV| 之 间 的 整数 ， 因 为 对 每 一 个 V 中 缚 点 都 对 应 一 个 发 现 事件 
和 一 个 完成 事件 。 对 每 一 顶点 mu， 有 

d[ 可 < fu] (23.1 

在 时 刻 d[u] 前 结 点 为 白色 ， 在 时 刻 d[ul] 和 ftu] 之 间 为 灰色 ， 以 后 就 变 为 黑色 。 

下 面 的 伪 代 码 就 是 一 个 基本 的 深度 优先 搜索 算法 ， 输 人 图 G 可 以 是 有 向 图 或 无 向 图 ， 
变量 time 是 一 个 全 局 变量 ， 用 于 记录 时 间 截 。 

DEFSIG) 
1 for 每 个 顶点 ucViGl 
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do eolortul < 一 WHITE 
xfukk-MNIL 
time 全 
fer 每 个 项 点 上 gwV[G] 
do ifcolor[Wj 王 WHITE 
then 下 FS-VISITIU) 


“< LU 


DEFS-WVISITID) 
1 colorft]< 一 全 RAY 从 昌 色 结 点 u 世 被 发 现 
2 djtime< time 十 1 

3 _ for 每 个 Y& Adj[u] 办 探 寻 边 (0 

二 doifcojofr[w=WHITE 

5 then ffv]< 

白 DEFS-VISITIw) 

7 eolor[u]<-BLACK 入 完成 后 竹 u 为 慰 色 

8 ff 一 tmes tmerl 


图 23.4 说 明了 DFS 在 图 23.2 所 示 的 图 上 执行 的 过 程 。 被 算法 探寻 到 的 边 吉 么 为 阴影 
覆盖 〈 如 果 该 边 为 树枝 ) ， 要 么 成 虚线 形式 (其 他 情况 )。 对 于 非 树 枝 的 边 ， 分 别 标明 B (或 


F]) 以 表示 反 向 边 、 交 叉 边 或 正 向 边 。 我 们 用 发 现时 刻 / 完成 时 刻 的 形式 对 结 点 加 瘟 时 间 
薇 . 


一 m 王 时 -而 过 古本 
罩 上 址 一 -ar 一 wu 二 9 ms 
和 而 了 ] 1 
iT 本 硬 ] 让 Te 下 下 妇 站 了 . 训 了 人 
世 和 本 本 CT 全 ae ss 了 一 “了 
ae 竖 Re 一 一 二 和- -也 
] 也 
他 了 人 他 本 
| 他 | | | | | 证 A ns me | 
中“ mm 昌 = 用 国 一 Ye 一 一 站 人 
T 关 可 me 一 一 -二 一 攻 2。-- te er ， W 二 
0 全 入 7 RS 二 
< 人 > 有 一 mm 2 本 ea -二 二 
一 er 一 一 一 = 一 一 一 
舍 于 百 下 四 
到 到 荆 下 本 和 
到 蚂 王 证 
到- 到 几 由 一 
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图 23.， 次 度 优 先 搜索 算 法 DFS 在 一 个 有 向 图 上 的 狼 行 过 程 
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过 程 PEFS 执行 如 下 。 第 1-3 行 把 所 有 结 点 别 为 白色 ， 所 有 域 初始 化 为 NIL。 第 4 行 
复位 全 局 变量 time， 第 和 7 行 依次 检索 V 中 的 结 点 , 发 现 白色 结 点 时 ， 调 用 DES-VISIT 去 
访问 该 结 点 。 每 次 通过 第 7 行 调用 DEFS-VISIT 时 ， 结 点 u 就 成 为 深度 优先 森林 中 一 棵 新 树 
的 根 ， 当 了 FS 返回 时 ， 每 个 结 点 都 对 诬 于 一 个 发 现时 记 dful] 和 一 个 完成 时 刻 frm]。 
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图 23.5 ”次 度 优 先 搜索 的 性 质 


每 次 开始 调用 DEFS-VISIT(W 时 结 点 习 为 白色 ， 第 1 行 置 u 为 灰色 ， 第 2 行使 全 局 时 间 
变量 增值 并 存 于 吕 u 中 ,从 而 记录 下 发 现时 刻 dm]， 第 3-6 行 检查 和 相 邻 接 的 每 个 顶点 
v， 且 知 Y 为 白色 结 点 ， 则 递归 访问 结 点 v。 在 第 3 行 语 和 句 中 考虑 到 每 一 个 结 点 vE Adjfu] 
” 时， 我 们 可 以 说 边 (u 只 被 深度 优先 搜索 探寻 。 最 后 当 以 u 为 起 点 的 所 有 边 都 被 探寻 后 ， 第 
7-8 行 语 句 置 员 为 黑色 并 记录 下 完成 时 间 ffu]. 

算法 了 FS 运行 时 间 的 复杂 性 如 何 ?DEFS 中 第 1-2 行 和 5-7 行 的 循环 占用 时 间 为 @(V)， 
这 不 包括 执行 调用 DFS-VISIT 过 程 庶 句 所 耗费 的 时 间 。 事 实 上 对 每 个 顶点 vEV， 过 程 
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DFS-VISIT 仅 被 调用 一 次 ， 因 为 DFS~VYISIT 仅 适 用 于 白色 结 点 且 过 程 首 先进 行 的 就 是 置 
结 扣 为 其 色 ， 在 DFS-VHSITO) 执 行 过 程 中 ， 第 3-6 行 的 循环 要 执行 |Adjlvjl 次 ， 因 为 ， 


YIAdj[ql=@(B)， 因 此 执行 过 程 DFS-VISIT 中 第 2-5 行 语句 占用 的 整个 时 间 应 为 @(B). 
所 以 DFS 的 运行 时 间 为 B(V+B)。 
深度 优先 搜索 的 性 质 


依据 深度 优先 搜索 可 以 获得 有 关 图 的 结构 的 大 音信 和 县。 也 许 深 度 优 先 搜索 的 最 基本 的 特 
征 是 它 的 先辈 子 轿 避 . 形成 一 个 由 树 组 成 的 森林 ， 这 是 因为 深度 优先 树 的 结构 准确 反 有 睐 了 
DEFS-VISIT 中 递归 调用 的 结构 的 缘故 , 即 u=r[v] 当 且 仅 当 在 搜索 的 邻接 天 过 程 中 调用 了 
进程 DFS-VISIT(w). - 
深度 优先 搜索 的 舅 一 重要 特性 是 发 现 和 完成 时 间 具 有 括号 结构 ， 如 果 我 们 把 发 现 项 点 
用 左 括号 “ua" 表 示 ， 完 成 用 右 插 号 “六 表示 ， 那 么 发 现 与 完成 的 记载 在 揪 号 被 正确 套用 的 前 
所 下 就 是 一 个 完善 的 表达 式 。 例 如 ， 图 23.5 示 出 了 诬 床 优 先 搜索 的 性 质 。 (ay 对 一 个 有 向 
图 进行 诬 度 优先 搜索 的 缚 果 。 结 点 的 时 间 惟 与 边 的 类 型 的 表示 方式 与 图 23.4 相同 。 (bj 图 
中 的 揪 号 表示 对 应 于 每 个 结 点 的 发 现时 刻 和 完成 时 刻 的 组 成 的 区 向 。 每 个 矩形 跨越 相应 结 点 
的 发 现时 刻 与 完成 时 肇 所 设 定 的 区 间 。 图 中 还 显示 了 树枝 。 如 果 两 个 区 间 有 重合 ， 则 必 有 一 
个 区 间 报 套 于 另 一 个 区 间 内 ， 且 对 应 于 较 小 区 间 的 缚 点 是 对 应 于 较 大 区 间 的 结 点 的 后 毅 。 
(c) 对 (aj 中 图 的 重新 措 述 ， 使 深度 优先 树 中 所 有 树枝 和 正 向 边 自 上 而 下 ， 而 所 有 反 向 边 
此 下 而 上 从 后 裔 指向 祖先 。 下 面 的 定理 给 出 了 标记 括号 鱼 构 的 另外 一 种 办 法 。 
定理 23. 人 括号 定理 ) 在 对 有 向 阁 或 无 向 图 G=(V,E) 的 任何 这 度 优先 搜索 中 ， 对 于 图 
中 任意 两 结 点 和， 下 述 三 个 条 件 中 有 一 条 (公有 一 和 条) 成立 : 
-区间 [[uj, ftu]j 和 和 区间 [dvj, fw 是 完全 分 离 的 . 
- 区 间 [d[uj, fa 完全 包含 于 区 间 [qdlv, fty] 中 且 在 膏 度 优 先 树 中 是 v 的 后 高 。 
- 区 间 [d[v]l, ffvJ 完 全 包含 于 区 间 [d[ul, fful 中 且 在 深度 优先 树 中 v 是 u 的 后 毅 。 
证 明 : 先 讨 论 duJ<dlv] 的 情形 ， 根 据 d[W 是 否 小 于 和 bj 又 可 分 为 两 种 情况 ， 第 一 种 情况 
若 dIvj<ftu， 这 样 v 已 被 发 现时 习 结 点 依然 是 灰色 ， 这 就 说 明 v 是 的 后 裔 ， 再 者 ， 因 为 
结 点 v 比 岂 发 现 得 较 晚 ， 所 以 在 搜索 返 同 结 点 并 完成 之 前 、， 所 有 从 出 发 的 边 都 已 被 探 
寻 并 已 完成 ， 所 以 在 这 种 条 件 下 区 间 [d[vl, ffv]] 必 然 完 全 包含 于 区 间 [dfuj, ffu]。 第 二 种 情况 
若 fuj<dlv]， 则 根据 不 等 式 23.1， 区 间 d[u, ftu] 和 区 间 [d[v, fw 必然 是 分 离 的 。 
对 于 d[v]<d[u] 的 情形 类 和 似 可 证 ， 只 蔓 把 上 述 证 明 中 中 和 Yv 对 调 一 下 即 可 。 (证 毕 ) 
推论 23.7( 后 裔 区 间 的 内 人 ) 在 有 向 或 无 向 图 G 的 深度 优先 森林 中 ， 结 节 Y 是 结 点 翌 
的 后 裔 当 且 仅 当 dm<dIv]<fw]<f] 
证 明 : 从 定理 23.6 即 可 推 得 。( 证 毕 ) 
在 深度 优先 森林 中 若 某 结 点 是 另 一 结 点 的 后 毅 ， 则 下 述 定 理 将 指出 它 的 另 一 重要 特征 ， 
定理 23.8( 白 色 路 径 定理 ) 在 一 个 图 扣 =(V,E)( 有 向 或 无 疝 图 ) 的 诬 度 优先 森林 中 ， 结 点 
v 是 结 点 的 后 裔 当 且 仅 当 在 搜索 发 现 习 的 时 刻 du]， 从 结 点 出 发 经 一 条 仅 由 白色 结 点 组 
成 的 路 径 可 达 v， 
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证 明 : 

一 : 候 设 v 是 的 后 总 ，w 是 深度 优先 树 中 忠 和 YYv 之 间 的 通路 上 的 任意 结 点 ， 则 w 必 ， 
然 是 于 的 后 裔 ， 由 推论 23.7 可 知 dm < d[w]j， 因 此 在 时 刻 dful]，w 应 为 白色 ， 

<-: 设 在 时 刻 dtu]， 从 到 v 有 一 条 仅 由 白色 结 点 组 成 的 通路 ， 但 在 深度 优先 树 中 v 还 
没有 成 为 a 的 后 毅 。 不 失 一 般 性 ， 我 们 假定 该 通路 于 的 其 他 顶点 都 是 的 后 毅 ( 和 否则 可 设 v 
是 该 通路 中 最 接近 的 结 点 ， 且 不 为 避 的 后 裔 )， 设 w 为 该 通路 上 v 的 祖先 ， 使 w 是 _u 的 后 
裔 (实际 上 w 和 翌 可 以 是 同一 个 结 点 ) 根据 推论 23.7 得 flwjsftul， 因 为 YE Adjfw]， 对 
DEFS-VISITCw) 的 调用 保证 完成 w 之 前 先 完成 Y， 因 此 fw]<ffw]sfftul。 因 为 在 时 刻 d[u] 结 
点 Y 为 白色 ， 所 以 有 dtuj<dIv。 由 推论 23.7 可 知 在 深度 优先 树 中 v 必然 是 u 的 后 高 。{ 证 
毕 ) 


边 的 分 类 


在 深 度 优先 搜索 中 , 另 一 个 令 人 感 兴趣 的 特点 就 是 可 以 通过 搜索 对 输 人 图 台 = (V,E) 的 
边 进行 归 类 ， 这 种 归 类 可 以 发 更 图 的 很 多 重要 信息 。 例 如 在 下 一 节 中 我 们 会 发 现 一 个 有 向 图 
是 无 回路 的 ， 当 且 仅 当 深 度 优先 搜索 中 没有 发 现 * 反 向 边 ”。 

根据 在 图 与 上 进行 深度 优先 搜索 所 产生 的 这 度 优先 森林 台 ， 我 们 可 以 把 图 的 边 分 为 四 
种 类 型 ， 

1. 树 校 ， 是 深度 优先 森林 G。 中 的 边 ， 如 果 结 点 v 是 在 探寻 边 (uw 时 第 一 次 被 发 现 ， 那 
么 边 ( 人 wj 就 是 一 个 树枝 。 

2. 反 和 问 边 ， 是 深度 优先 树 中 连结 结 点 也 到 它 的 祖先 v 的 那些 边 ， 环 也 被 认为 是 反 向 边 。 

3. 正 向 边 ， 是 指 深度 优先 树 中 连接 顶点 到 它 的 后 帘 的 非 树枝 的 边 。 

4. 交 叉 边 ， 是 指 所 有 其 他 类 型 的 边 ， 它 们 可 以 连结 同一 棵 深度 优先 树 中 的 两 个 结 点 ， 只 
要 一 结 点 不 是 另 一 结 点 的 祖先 ， 也 可 以 连结 分 属 两 棵 深度 优先 树 的 结 点 ， 

在 图 23.4 和 23.5 中 ， 都 对 边 进 行 了 类 型 标示 。 图 23.5(c) 还 说 明了 如 何 重 新 绘制 图 
23.5(a) 中 的 图 、 以 使 深度 优先 树 中 的 树枝 和 正 向 边 向 下 绘制 ， 使 反 向 边 向 上 绘制 。 任 何 图 都 
可 用 这 种 方式 重新 绘制 。 

可 以 对 算法 DEFS 进行 一 些 修改 ,使 之 遇 到 边 时 能 对 其 进行 分 类 。 算 法 的 核心 愿 想 在 于 
可 以 根据 第 一 次 被 探寻 的 边 所 到 达 的 结 点 Y 的 颜色 来 对 该 边 作 ,内 进行 分 类 (但 正 向 边 和 交 叉 
边 不 能 用 颜色 区 分 出 )。 

4. 自 色 表明 它 是 树枝 。 

2. 芯 色 说 明 它 是 反 向 边 。 

3. 黑 色 说 明 它 是 正 向 边 或 交叉 边 。 

第 一 种 情形 由 算法 即 可 推 知 。 在 第 二 种 情形 下 ， 我 们 可 以 发 现 灰色 结 点 总 是 形成 一 条 对 
应 于 活动 的 DFS-VISiIT 调用 堆栈 的 后 痪 线性 链 ， 厌 色 结 点 的 数目 等 于 最 近 发 现 的 结 点 在 深 
度 优 先 森 林 中 的 次 度 加 1， 探 寻 总 是 从 深度 最 诬 的 厌 色 结 点 开始 ， 因 此 达到 另 一 个 灰色 结 战 
的 按 所 达到 的 必 是 它 的 祖先 。 余 下 的 可 能 就 是 第 三 种 情形 ， 如 果 dlu]<d[v]， 则 边 (u,w) 就 是 
正身 边 ， 者 dlu>dfv， 则 (办 便 是 记 叉 边 ( 见 练习 23.3 一 4)。 

在 无 向 图 中 ， 由 于 作风 和 (四 实际 上 是 同一 条 按 ， 所 以 对 边 进行 这 种 归 类 可 能 产生 足 
义 。 在 这 种 情况 下 ， 图 的 边 都 被 妇 为 归 类 表 中 的 第 -- 类 ， 对 庶 地 ( 见 练习 23.3 一 5)， 我 们 将 根 
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据 算 法 执行 过 程 中 首先 遇 到 的 边 是 (ny} 还 是 (vd 来 对 其 进行 归 类 。 

-下面 我 们 来 说 明 在 深度 优先 搜索 一 无 向 图 时 不 会 出 现 正 向 边 和 交叉 边 。 

定理 23.9 在 对 无 向 图 G 进行 深度 优先 搜索 的 过 程 中 ， 台 的 每 条 过 要 么 是 树 校 ， 要 么 
是 反 向 边 。 

证 明 设 (uy) 为 串 的 任意 一 边 ， 不 失 一 般 和 性， 很 定 da< dlyj， 则 因为 v 在 立 的 邻接 表 
中 ， 所 以 我 们 必定 在 完成 上 之 前 就 已 发 现 并 完成 Y。 如 果 边 (uw) 第 一 次 是 按 从 到 * 的 方向 
被 探寻 到 ， 那 么 (uW 必 是 一 树 校 ， 如 果 ( 人 ay) 第 一 次 是 按 从 vv 到 的 方向 裤 探 寻 到 ， 则 由 于 
该 边 被 第 一 次 探寻 时 依然 是 藉 色 结 点 ， 所 以 fu) 是 一 条 反 向 边 。{ 证 毕 ) 

在 下 面 的 章节 中 我 们 将 密 次 应 用 这 些 定 理 。 





图 23 渗 ”用 于 练习 23.3-2 和 23.5-2 中 的 有 向 图 


23.4 拓扑 排序 


本 节 说 明了 如 何 运 用 深度 优先 搜索 ， 对 一 个 有 向 无 回路 图 进行 拓扑 排序 ， 我 们 有 时 称 这 
种 图 为 dag。 对 这 种 有 向 无 回路 图 的 拓扑 排序 的 结果 为 该 图 所 有 顶点 的 一 个 线性 序列 ， 狂 中 
如 果 日 包 会 (WwW， 则 在 序列 中 心 出 现在 v 之 前 (如 果 图 是 有 回路 的 就 不 可 能 和 仔 在 这 样 的 线性 
序列 )。 一 个 图 的 拓扑 排序 可 以 看 成 是 图 的 所 有 项 点 沿 水 平 线 排 成 的 一 个 序列 , 使 得 所 有 的 
有 向 边 均 从 左 指向 在。 因此， 拓扑 排序 不 同 于 我 们 在 第 二 篇 中 讨论 的 通 篆 意义 上 的 排序 。 

有 问 无 回路 图 经 党 用 于 说 明 事 件 发 生 的 先后 次 序 ， 图 23.7 给 出 一 个 实例 资 明 早晨 穿 让 
的 过 程 。 必 须 先 穿 基 一 衣物 才能 再 穿 其 他 衣物 (如 先 穿 袜子 后 穿 鞋 )， 也 有 一 些 衣物 可 以 按 任 
意 次 序 穿 戴 ( 如 袜子 和 短裤 )} 图 23.7(g) 所 示 的 图 中 的 有 向 边 (o,Y) 表 上 明 衣 服 _ 必须 先 于 衣服 Y 和 穿 
戴 。 因 此 该 图 的 拓扑 排序 给 出 了 一 个 穿 衣 的 顺序 。 每 个 顶点 劳 标的 是 发 现时 刻 与 完成 时 译 。 
图 23.7(b) 说 明 对 该 图 进行 拓扑 排序 后 将 油水 平 线 方向 形成 一 个 顶点 序列 ， 使 得 图 中 所 有 有 
，、 启 按 均 从 左 指向 右 。 
下 列 简 单 算 法 可 以 对 一 有 回 无 回路 图 进行 拓扑 排序 。 

TOPOLOGICAIL-SORTCG) 

1. 调 用 DEFES(G7i 计 算 每 个 预 点 的 完成 时 间 ffv] 

2. 当 每 个 顶点 完成 后 ， 把 它 搬 人 链表 前 端 

3. 返 回 由 顶点 组 成 的 链表 
23.7(b) 说 明 经 拓扑 排序 的 结 点 以 与 其 完成 时 刻 相 反 的 顺序 出 现 。 
因为 深度 优先 搜索 的 运行 时 间 为 @(VTE)， 每 一 个 Y 中 绪 点 插 人 链表 需 占 用 的 时 间 为 
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O(H， 因 此 进行 拓扑 排序 的 运行 时 间 为 @(V+E}。 

为 了 证 明 算法 的 正确 性 、 我 从 运用 了 下 面 有 美 有 向 无 回路 图 的 重要 引 理 。 

引 理 23.10 有 有 癌 图 吕 无 回路 当 听 公 当 对 避 进行 次 度 优先 搜索 没有 得 到 和 肥 向 按 。 

证 明 

~: 假设 有 -- 条 反 回 边 0uvj， 那 么 在 深度 优先 森林 中 结 点 Y 必 为 续 点 二 的 祖先 ， 固 些 
G 中 从 vv 到 1 必 存 在 一 通路 ， 这 … 时 路 痢 边 轨 斩 霹 一 个 回路 。 

<-: 假设 G 中 包含 一 回路 CC， 我 们 证 明 对 己 的 深度 优先 搜索 将 产生 一 条 反 向 边 。 设 v 
是 回路 和 中 第 一 个 被 发 现 的 结 点 且 入 人 内 旦 安 中 的 优先 过 ， 在 时 刻 dfv] 从 v 到 u 存 在 一 条 
四 白色 结 点 给 成 的 通路 ， 根 据 自 色 路 蔗 定 理 可 知 在 深度 优先 森林 中 结 点 必 是 结 点 Y 的 后 
高 ， 因而 (av) 是 一 条 反 向 边 。 (证 圭 ) 

“定理 23.11 TOPOLOGICAL-SORT(G) 算 法 可 产生 有 向 无 回路 图 G 的 拓扑 排序 。 

证 明 : 眼 设 对 一 已 知 有 向 学 回路 图 台 =(Y 上 上) 这 行 过 程 DFS 以 确定 其 结 点 的 完成 于 刻 。 
那么 只 要 证 明 对 性- 一 对 不 同 结 点 uyeV， 若 台中 存在 一 条 从 习 到 v 的 有 向 边 ， 则 fw1<tfo] 
即 本 .考虑 过 程 DESLGJ 于 探寻 的 任何 这 (uvj， 当 探寻 到 该 过 时 ， 铺 总 w 机 研 能 为 次 色 ， 答 
则 v 将 成 为 下 的 衬 先 ，tav) 将 是 一 条 反 向 地， 机 引 理 23.10 季 着 。 因 此 ，v 必定 是 计 色 或 络 
色 结 点 。 若 v 是 旧 色 ， 它 就 成 为 u 的 后 毅 ， 因 此 有 fivj<ffal， 芳 vv 是 黑色 ， 间 样 有 
ftvj<ffdj。 这 样 一 来 对 于 茵 中 任意 边 (uw)， 都 有 ffv1<ttal， 从 而 定理 得 让 。( 证 毕 ) 
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疼 23.7 时 碟 竺 让 的 过程 
23.$ 强 连 通 支 


我 们 现在 来 考虑 深 刘 优 先 搜索 的 一 个 经 典 度 用 实例 : 把 有 癌 图 分 解 为 强 连 通 支 。 本 节 将 
介绍 如 何 使 用 两 个 深度 优先 搂 案 过 程 来 进行 这 种 分 船 ， 很 多 有 关 有 问 图 的 算法 者 从 分 解 步骤 
开始 ， 这 种 分 解 可 把 原始 的 问题 分 成 数 个 子 问题 ， 其 中 每 个 子 问题 对 应 一 个 强 连通 支 。 构 造 
强 连 前 支 之 间 的 联系 也 就 把 子 问题 的 解决 方法 联系 在 一 起 ， 我 们 可 以 用 一 种 称 之 为 分 支 图 的 
图 来 表示 这 种 构 浅 (其 定义 见 练习 23.5-4)。 
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回忆 第 五 章 中 讲述 过 ， 一 有 向 图 G=(V， 马 的 强 连 通 支 是 浪 足 如 下 条 件 的 最 大 顶点 集 
USEV: 对 任意 一 对 顶点 u，vYEU， 有 u~ev 和 v~wu 同时 成 立 ， 即 顶点 和 顶点 Y 互 为 可 
达 ， 图 23.9 展示 了 一 个 实例 。 (ay 有 向 图 G。 图 中 的 阴影 区 域 就 是 G 的 强 连 通 子 图 。 对 每 " 
个 顶点 都 标 出 了 其 发 现时 刻 与 完成 时 刻 。 阴 影 覆盖 的 边 为 树枝 。 (bj 怠 的 转 置 图 G7。 图 中 
说 明了 STRONGLY-CONNECTED-COMPONENTS 第 3 行 计 算出 的 深度 优先 树 ， 其 中 ， 
阴影 覆盖 的 边 是 树枝 .每 个 强 连 通 子 图 对 应 于 一 棵 深度 优先 树 。 图 中 涂 上 阴影 的 顶点 b， 
c，g 和 jh 是 强 连 通 子 图 中 每 个 顶点 的 祖先 ， 这 些 顶 点 也 是 对 台 ` 进行 深度 优先 搜索 所 产生 的 
. 次 度 优先 树 的 树 根 。(c) 把 G 的 每 个 强 连通 子 图 缩减 为 单个 顶点 后 所 得 到 的 无 回路 子 图 
人 SC 

寻找 图 G=(V， 孔 的 强 连通 支 的 算法 中 使 用 了 G 的 转 置 ， 其 定义 已 在 练习 23.1~3 中 给 
出 : GI=(V，ED，EI={，w (9， 由 EBE}. 即 EI 由 对 中 的 边 改 变 方向 后 组 成 。 著 已 知 
G 的 邻接 表 ， 则 建立 G 所 需 时 间 为 O(V+E)。 注 意 到 下 面 的 结论 是 很 有 趣 的 : 台 和 Gr 
有 着 完全 相同 的 强 连通 支 : 即 在 G 中 u 和 YY 互 为 可 达 当 且 仅 当 在 G- 中 它们 互 为 可 达 。. 图 
23.9(b 即 为 图 23.9(a) 所 示 图 的 转 置 ， 其 强 连通 支 上 涂 了 阴影 


《8 


(b) 


(tc) 





图 23.9 ”连通 子 图 


下 列 线性 时 间 ( 即 运行 时 间 为 9(Y+BE)) 算 法 可 得 出 有 向 图 G= (V,E) 的 强 连通 支 ， 该 算法 
使 用 了 两 次 深度 优先 搜索 ， 一 次 在 图 G 上 进行 ， 另 一 次 在 图 GT 上 进行 。 

STRONGLY-CONNECIED-COMPONENTSIG) 

1 调用 DFS(G) 以 计算 出 每 个 结 点 平 的 完成 时 刻 ff 

2. 计 算出 G::; 


一 334- 一 


3. 调 用 DTFS(G )， 全 在 DFS 的 主 杠 环 间接] 遂 的 顺序 考 上 各 结 点 (和 第 一 行 中 一 样 计 
算 ); ， 
4. 输 出 第 .3 步 中 产生 的 深度 优先 森林 中 每 棵 树 的 结 点 ， 作为 各 自 独立 的 强 连通 支 。 


这 一 犁 似 简单 的 算法 似乎 和 强 连 通 支 无 关 。 在 本 节 的 余下 部 分 里 ， 我 们 将 揭 开 这 一 设计 
思想 的 秘密 并 证 明 算法 的 正确 性 。 我 们 将 从 两 个 有 用 的 观察 资料 人 手 ， 

引 理 23.12 ”如 果 两 个 结 点 处 于 同一 强 连通 支 中 ， 那 么 在 它们 之 间 不 存在 离开 该 连通 支 
的 通路 。 

证 明 : 设 和 YYv 是 处 于 同一 强 连 通 支 的 两 个 结 点 ， 根 据 强 连通 支 的 定义 ， 从 阐 到 v 和 
从 v 到 绷 有 通路 ， 设 结 点 w 在 某 一 通路 ur~wrwy 上 ， 所 以 从 阐 可 达 w、 又 因为 存在 通路 
v~au， 所 以 可 知 从 交通 过 路 径 w~ev~ru 可 达 u， 因 此 和 豆 在 同一 强 连 通 支 中 。 因 为 w 是 
任意 选 定 的 ， 所 以 引 理 得 证 。 (证 毕 ) 

定理 23.13 ”在 任何 深度 优先 搜索 中 ， 同 一 强 连通 支 内 的 所 有 顶点 均 在 同一 栋 深 度 优先 . 
树 中 。 
证 明 : 在 强 连 通 支 内 的 所 有 结 点 中 ， 设 第 一 个 被 发 现 ， 因 为 T 是 第 一 个 被 发 更， 所 以 
发 现 T 时 强 连通 支 内 的 其 他 结 点 都 为 白色 。 在 强 连 通 支 内 从 T 到 每 一 其 他 结 点 均 有 通路 ， 琴 
为 这 些 通 路 都 没有 离开 该 强 连 通 支 [ 据 引 理 23.123) 所 以 其 上 所 有 结 点 询 为 白色 。 因 此 根据 白 
色 路 径 定理 ， 在 深度 优先 树 中 ， 强 连通 支 内 的 每 一 个 结 点 都 是 结 点 T 的 后 高 。( 证 毕 ) 

在 本 节余 下 的 部 分 中 ， 记 号 du 和 ffu] 分 别 指 由 算 落 STRONGLY- CONNECTED 一 
COMPONENTS 第 1 行 的 这 度 优先 搜索 计算 出 的 发 现 和 完成 时 刻 。 类 似 地 ， 符 号 U 是 
指 台 中 而 不 是 G5 中 存在 的 一 条 通路 . 

为 了 证 明 算法 STRONGLY-CONNECTED-COMPONENTS 的 正确 性 ， 我 们 引进 符 
导 和 (表示 结 点 14 的 祖宗 w， 它 是 根据 算法 第 1 行 的 次 度 优 先 搜索 中 最 后 完成 的 从 习 可 达 
的 结 点 。 换 句 话说 ， 下 (= 满足 ur~ww 入 fw] 有 最 大 值 的 缚 点 w。 

注意 有 可 能 @(m=u， 因 为 对 其 自身 当然 可 达 ， 所 以 有 


ftujsfietl (23.) 
我 们 同样 可 以 通过 以 下 推理 证 明 @(e(o) 一 go)， 对 任意 结 点 上 vEY 
un 说明 fle(mlsfaol (23.3) 


因为 {w:， vvrawE{w: urew}， 且 祖宗 结 点 是 所 有 可 达 结 点 中 具有 最 大 完成 时 刻 的 结 点 。 

又 因为 从 可 达 结 点 Gu， 所 以 公式 (23.3) 表 明 fb 和 flGOaj， 根 据 不 等 式 (23.2) 
同样 有 fg@(ol sffa(@Go]， 这 样 TiE(Bo]=fa(o] 成 立 。 所 以 有 EEC(= 和 (mu， 因 为 知 
两 结 点 有 同样 的 完成 时 肇 ， 则 实际 上 两 结 点 为 同一 结 点 。 

我 们 将 发 现 每 个 强 连通 支 中 都 有 一 结 点 是 其 中 每 一 结 点 的 祖宗 ， 该 结 点 称 为 相应 强 连通 
支 的 “代表 性 结 点 "。 在 对 图 局 进行 的 深度 优先 搜索 中 ， 它 是 强 连 通 支 中 最 先 发 现 且 最 后 宪 
成 的 结 点 。 在 对 G- 的 深度 优先 搜索 中 ， 它 是 深度 优先 树 的 树 根 ， 我 们 现在 来 证 明 这 一 性 
质 . 

第 一 个 定理 中 称 @(Oa) 是 的 宜 宗 结 点 。 

定理 23.14 已 知 有 向 图 G=(V，B)， 在 对 G 的 深度 优先 搜索 中 ， 对 任意 结 点 uk v， 
其 祖宗 Qu 是 的 祖先 。 
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证 明 : 如 果 和 =u， 定 理 自然 成 立 。 如 果 (umu， 我 们 来 考虑 在 时 刻 dfu] 各 结 点 的 
颜色 ， 若 (om 是 黑色 ， 则 ffdtm]<ffaj， 这 与 不 等 式 (23.2) 了 矛盾 ， 车 惠 (o) 为 灰色 ， 出 它 是 结 
点 了 的 祖先 ， 从 而 定理 可 以 得 证 。 ， 

现在 只 要 证 明 @(o) 不 是 自 色 即 可 ， 在 从 = 到 中 (m) 的 通路 中 车 存在 中 间 结 点 ， 则 根据 其 
郑 色 可 分 两 种 情况 : 

1. 若 每 一 中 间 结 点 均 为 身 色 ， 那 么 由 向 色 路 径 写 理 知 do 是 的 后 商 ， 则 有 
ffo]<f]， 这 与 不 等 式 (23.2) 相 秆 盾 。 

2. 车 有 某 个 中 间 结 点 不 是 白色 ， 没 1 是 从 到 由 (四 的 通路 上 最 后 一 个 非 白 结 点 ， 则 由 于 
不 可 能 有 从 黑色 结 点 到 白色 结 点 的 边 存在 ， 所 以 + 必 是 灰色 。 这 样 就 存在 一 条 从 1 到 du) 且 
由 外 色 结 点 组 成 的 通路 、 因 此 根据 白色 路 径 定 理 可 推 知 由 o) 是 t 的 后 壳 ， 这 表明 有 
瑟 ]> ffb(tul 成 立 ， 得 从 到 + 有 通路 ， 这 与 我 们 对 由 的 选择 相 季 盾 。( 证 毕 ) 

推论 23.4S 在 对 有 向 图 G= (V，B) 的 任何 深 寡 优先 搜索 中 ， 对 所 有 uC V， 结 点 和 
dt 由 处 二 同一 个 强 连通 支 内 。 

证 上 明 : 击 对 祖宗 的 定义 有 ug， 同时 因为 gf(u) 是 _ 的 祖先 ， 所 以 又 有 @(ujeu。 
《证 毕 ) 

下 面 的 定理 给 出 了 一 个 关于 祖宗 和 强 连 通 支 之 问 联系 的 更 强 有 力 的 结论 ， 

定理 23.16 ”在 有 向 图 G(V，B) 中 ， 两 个 结 点 t，vEY 处 于 同一 强 连通 支 肉 ， 当 且 仅 当 
对 G 进行 深度 优先 搜索 时 两 结 点 具有 同一 祖宗 。 

证 明 : -~*: 假设 a 和 * 处 于 间 一 强 连 通 支 内 ， 从 斌 达 的 每 个 结 点 也 满足 从 v 可 达 ， 
反之 亦 然 。 这 是 由 于 在 u 和 vv 之 间 存 在 双 内 通路 ， 由 祖宗 的 定义 我 们 可 以 推 知 
(ou 一 由 (v)。 

<: 假设 Bo = do 成立， 据 推论 23.15，u 和 和 (由 在 峭 一 强 连通 支 内 且 v 和 do 也 处 
于 同 --- 强 连通 支 内 ， 罗 此 m 和 也 在 邮 - 一 强 连 通 支 中 .。《 证 毕 ) 

有 寺 定 理 23.16， 算 法 STRONGLY-CONNECTED-COMPONENTS 的 结构 就 容易 
掌握 了 。 强 连 通 支 就 是 有 着 同一 祖宗 的 结 点 的 集合 。 再 根据 定理 23.14 和 括号 定理 (定理 
23.6) 可 知 , 在 算法 第 ! 行 所 述 的 深度 优先 搜索 中 。 祖 宗 是 其 所 在 强 连 通 支 中 第 一 个 发 现 昌 最 
后 -个 完成 的 钳 点 。 

为 了 漠 清 楚 为 什么 在 算法 STRONGLY-CONNECTED-COMPONENTS 的 第 3 行 要 
对 GT 进行 深度 优先 搜索 ， 位 考察 夸 的 第 行 的 深度 优先 旬 案 所 计算 由 的 具有 最 天守 
时 刻 的 结 点 r， 和 根据 棚 宗 的 定义 可 知 结 点 工 必 为 一 祖宗 结 点 ， 这 是 因为 它 是 自身 的 相 索 
可 以 到 达 自 身 且 图 中 其 他 结 点 的 完成 时 刻 均 小 于 它 。 在 上 的 强 连 通 支 中 还 有 其 他 哪些 结 eg 
它们 是 那些 以 r 为 祖 和 的 缚 点 --- 指 可 达 但 秘 可 达 任何 完成 时 刻 大 于 红 ] 的 结 点 的 那些 结 
点 。 得 由 于 在 G 中 上 是 完成 时 刻 最 大 的 结 点 ， 所 以 r 的 强 连通 支 仅 由 那些 可 达 r 的 结 点 组 
成 ， 烙 和 何 话说 ，r 的 强 连 通 支 由 那些 在 GT 中 从 上 + 可 达 的 也 点 组 成 。 在 算法 第 3 行 的 深度 优 
先 搜索 识别 出 所 有 属于 上 强 连通 支 的 结 点 ， 并 抬 它 们 置 为 黑色 (宽度 优先 搜索 或 任何 对 可 达 结 
-点 的 搜索 可 以 阅 样 容易 地 做 到 这 一 点 )， 

在 执行 完 第 3 行 的 深度 优先 搜索 并 识别 出 r 的 强 连 通 支 以 后 ， 算 法 又 从 不 属于 强 连 通 ， 
支 且 有 着 最 大 完成 时 刻 的 任何 结 点 ”重新 开始 搜索 。 结 点 必 为 其 自身 的 祖 人 ， 因 为 由 它 不 
可 能 达到 任何 完成 时 刻 大 于 它 的 其 他 结 点 (否则 ”将 包 售 于 上 的 强 连通 支 中 )。 根 据 类 似 的 扒 
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理 ， 可 达 且 不 为 黑色 的 任何 结 点 几 属 于 半 的 强 连通 支 ， 因 而 在 第 3 行 的 深 典 优先 搜索 继续 
进行 时 ， 通 过 在 G 中 从 习 开始 搜索 可 以 识别 出 属于 TY 强 连通 支 的 每 个 结 点 并 将 其 年 为 黑 ， 
色 。 

因此 通过 第 3 行 的 这 度 优先 搜索 可 以 对 图 “用 苦 章 皮 "， 逐 个 取得 图 的 强 连 通 。 拒 每 个 
强 连通 支 的 扯 宗 作 为 自 变量 调用 DEFS-VISIT 过 程 ， 我 们 就 可 在 过 程 DEFS 的 第 了 行 识 别 出 
每 -- 支 。DES-VISII 过 程 中 的 递归 调用 最 终 使 支 内 每 个 结 点 都 成 为 黑色 。 当 DFS-VISIT 
返 问 到 DES 中 时 ， 整 个 支 的 结 点 都 变 成 黑色 且 被 “ 刹 离 ”， 接 着 DEFS 在 那些 非 黑色 结 战 中 
寻找 县 有 最 大 完成 时 刻 的 结 点 并 把 该 结 点 作为 另 一 支 的 祖宗 继续 上 述 过 程 。 

下 面 的 定理 形式 化 了 以 土 的 论证 。 

定理 23.47 过 程 STRONGLY-CONNECTED~-COMPONENTSIG) 可 正确 计 算出 有 
站 G 

: 通过 对 在 马上 进行 这 麻 优先 搜索 中 发 现 的 深度 优先 树 的 数目 进行 归纳 ， 可 以 证 

同仁 横 榈 的 结 点 划 形 砚 一 强 连通 支 ， 归 纳 论 证 的 每 一 步 慑 都 证 明 对 G' 进行 深度 优先 搜索 
形成 的 树 是 一 强 连 通 支 ， 稻 定 所 有 在 先生 成 的 树 都 基 强 连通 支 。 归 纳 的 基础 是 显而易见 的 ， 
这 是 因为 产生 第 一 棵 树 之 前 无 其 他 树 ， 因 而 假设 自然 成 立 。 

考察 对 避 " 进行 深度 优先 搜索 所 产生 的 根 为 工 的 一 棵 次 度 优先 树 T， 设 CD 表示 为 家 
宗 的 所 有 结 点 的 集合 : 

CTvEV ED)= 虽 

现在 我 们 来 证 明 结 点 习 被 放 在 树 工 中 当 且 仅 当 ut Cr) 

<-: 由 定理 23.13 可 知 Cj 中 的 每 一 个 结 点 都 终止 王 则 一 棵 深度 优先 树 。 因 为 TC CD 
及 T 是 工 的 根 ， 所 以 C 中 的 每 个 元 素 皆 余 灶 于 下 

-~: 通过 对 两 种 情形 fl@(w]> 二 ] 或 fw]<fr] 分 别 考虑 ， 我 们 来 证 明 这 样 的 结 点 w 
不 在 树 工 中 。 通 过 对 已 发 现 树 的 数目 进行 归纳 可 知 满足 fb(wj]> 和 的 任何 结 点 mw 不 在 树 工 
中 ， 这 是 由 于 在 选择 到 Y 时 ， 四 已经 被 放 在 根 为 Btw) 的 树 中 。 满 足 fwj]<fir] 的 任意 结 
不 可 能 在 树 下 中， 这 是 因为 苦 w 被 交大 T 中 ， 则 有 wx: 因此 根据 式 (23.3) 和 性 质 
f= 中 fr)， 可 得 fig(wjjz>zttBr=f、 这 各 1 有 (w)< RnD 相 乞 居 。 

这 样 树 工 仅 包 含 那些 注 足 和 (wj=T 的 结 点 u， 邮 工 实际 上 就 是 强 连 通 支 CD)， 这 样 就 完 
成 了 归纳 证 明 。{ 证 毕 ) 


思 考 题 


23-1 通过 宽度 优先 搜索 对 边 进行 分 类 


深度 优先 森林 把 图 的 边 分 为 树枝 、 正 向 边 ， 反 人 向 边 和 交叉 边 四 种 类 型 。 谋 用 宽度 优先 树 
园 样 可 把 从 源 结 点 可 达 的 边 分 为 相同 的 四 种 类 型 。 
a. 证 明 在 对 无 向 图 的 富 和 谋 优 先 搜索 中 存在 下 列 性 质 : 
1. 不 存在 正 向 边 和 六 向 边 
2. 对 于 每 一 树枝 (0，v) 有 d[v]= duj+l 
3. 对 于 每 一 交叉 边 (0，v) 有 d[v]= du 或 dIw]= adult 
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b. 证 明 在 对 有 向 图 的 宽度 优先 搜索 中 ， 有 下 列 性 质 成 立 : 
1. 不 存在 正 向 边 。 

2. 对 于 每 一 树枝 (0， 闷 有 dtv]= d[ul+i 

3. 对 于 每 一 交叉 边 人 a， 阅 有 dy] 大 d[u]+l 

4. 对 每 一 反 向 边 (kk， 丸 有 0 和 dvl<d] 


23-2 和 挂 接点 、 桥 以 及 双 连 通 子 转 


设 台 =(VY， 了 马 是 一 无 向 连通 了 图， 如 果 去 掉 G 的 某 结 点 后 G 就 不 是 连通 图 ， 这 样 的 结 点 
称 为 挂 接点 。 如 果 去 掉 某 一 边 台 就 不 成 为 连通 图 ， 这 样 的 边 称 为 桥 。G 的 双 连 通 子 图 是 满 
足 集 合 中 任意 两 条 边 都 处 于 一 公用 简单 回路 上 的 最 天 边 集 。 图 23.10 说 明了 上 述 定义 。 图 中 
涤 上 阴影 的 结 点 为 挂 接点 ， 阴 影 材 盖 的 边 为 桥 ， 图 中 阴影 覆盖 的 区 域 中 的 边 表示 双 连 通 子 
”图 我们 可 以 用 深度 优先 搜索 来 确定 挂 接点 、 桥 以 及 双 连 通 子 图 .。 设 G。= (VY，E,) 是 已 的 
一 棵 深度 优先 树 。 

a- 证 明 局 。 的 根 是 局 的 挂 楼 点 当 且 仅 当 在 马 。 中 该 根 结 点 至 少 有 两 个 子女 。 

b. 设 Y 是 G。 中 的 某 一 非 根 结 点 ， 证 明 v 是 图 G 的 挂 接 点 当 且 仅 当 车 在 G。 中 心 是 v 的 
后 裔 且 w 是 v 某 一 钥 先 则 不 存在 (u，w})? 这 样 的 反 向 边 。 


5. 设 
lowfy] = [OO 
{d[w]: 对 v 的 某 后 吝 ，(u，w) 是 反 向 边 } 
试 说 明 对 所 有 结 点 ve V， 如 何在 O(E) 时 间 内 计算 出 ov 人 9) 
” 半 说 明 如 何在 时 间 CBE) 内 计算 出 所 有 挂 接点 。 

e. 证 明 G 的 某 边 是 桥 当 且 仅 当 它 不 属于 与 的 任何 简单 回路 . 

上 试 说 明 如 何在 时 间 DIE) 内 计算 出 所 有 的 桥 。 

.证 明 SG 的 双 连 通 子 图 划分 了 SG 的 非 桥 边 .。 

Rh. 写 出 一 运行 时 间 为 O(E) 的 算法 , 它 对 台 的 每 条 边 e 标示 一 正 整数 bccfe], 使 得 
bccfe]=bcc[e] 当 且 仅 当 e 和 在 同一 双 连 遂 子 图 中 . 





图 23.10， 问 题 23--2 所 用 到 的 有 向 连通 图 的 挂 接点 、 桥 以 及 双 连 通 子 图 


23-3 欧 拉 回 路 


有 向 连通 图 G=(V，B) 的 欧 拉 回 路 是 通过 中 每 条 边 一 次 (但 可 以 访问 某 个 结 点 多 次 ) 
的 一 个 回路 ， 


一 338 一 


a&. 证 明 图 G 具有 欧 拉 问 路 当 且 仅 当 对 每 一 结 点 vEV， 都 有 其 人 度 和 出 度 相等 ， 
in 一 degreeltv) 一 bt-degreefv) 


bp 者 图 G 存在 欧 拉 回 路 ， 描 述 一 运行 时 间 为 O(B) 的 算法 来 找 出 这 一 回路 ， 
练习 二 十 三 


全] 已 知 一 个 有 商 图 的 邻接 表 ， 计 算 每 个 顶点 的 出 庚 和 人 度 需 要 多 长 时 间 ? 

妇 4.1-2 出 一 棵 有 了 个 顶点 的 完全 二 允 树 的 邻接 表 ， 并 写 出 对 应 的 部 接 上 矩 甸 ， 假定 所 有 顶点 拨 二 尺 
扒 的 形式 从 1 到 了 编号 。 

23.1-3 有 向 图 台 ={VY， 了 如 的 转 奸 是 轩 GT= (V， (V，E ) 其 中 EI=ifw， DEVxy: (ta VEEI， 因 此 GT 
0 台所 有 按 反 商 所 成 的 图 。 写 出 一 个 从 局 计算 GT 的 有 效 算 法 (近邻 接 表 和 邻接 柴 阵 两 种 形式 分 别 写 

， 并 分 析 算 法 的 运行 时 间 。 

23.1-4 已 知 一 多 重 图 G= (V， B) 的 邻接 表 ， 试 写 出 一 算法 满足 下 列 条 件 ， 算 法 的 时 间 复 杂 性 为 
O(V+E)， 要 求 得 出 与 图 “等 价 " 的 无 向 图 G=(V，BI 的 邻接 表 ， 其 中 玫 如 下 构成 : 把 五 中 两 顶点 间 的 多 重 
边 以 一 条 边 伐 搞 ， 并 且 去 掉 E 中 所 有 的 环 . 

23.1-~5 有 向 图 各 =(V， 也 的 平方 是 图 如 :一 (Y，E3， 该 图 满足 下 列 条 件 : 人 n， 四 EE: 当 且 仅 当 对 v 
& Yu， 帮 EPE 且 (，w)fE E。 即 若 图 后 中 顶点 正和 w 之 间 存 在 一 长 度 为 2 的 路 径 时 ， 则 怠 : 必 和 所 音 该 边 
总 ，)。 允 了 已 二 图 G 的 邻接 表 和 邻接 矩阵 两 种 表示 法 ， 分 别 写 出 从 邱 产 生 G 的 有 效 算 法 ， 并 分 析 算 法 
的 运行 时 间 。 

23.1 -6 采用 邻接 矩阵 时 ， 大 狗 数 图 的 算法 的 时 间 复 杂 性 为 和 @fv， 但 也 有 例外 。 即 憾 采用 邻 榜 矩阵 ， 
确定 一 个 有 向 图 中 是 否 包 含 一 个 汇 ( 人 凑 为 |Yi-1， 出 度 为 0 的 项 点 ) 的 算法 的 时 间 复 杂 性 为 O(V)， 试 说 明 
之 。 . 
23.1-7 有 向 图 台 =(Y， 了 B) 的 关联 矩阵 了 B= (bi) 是 一 个 |Vjx 四 | 皂 阵 ， 江 足下 列 条 件 : 

-1 若 近 j 与 项 点 i 美 联 ， 且 ij 是 边 j 的 起 点 

b -| 车 边 j 与 项 点 ij 关联， 用 ji 是 边 j 的 终点 

0 其 他 
试 述 矩 阵 飞 积 BB- 所 得 矩阵 元 素 有 何 意义 ， 其 中 BT 为 B 的 转 置 算 阵 


23.2-! 给 出 宽度 优先 搜索 算法 在 图 23.2(a) 所 示 的 有 向 图 上 运行 的 结果 ， 用 顶点 3 作为 源 顶 点 . 

23.2-2 给 出 宽度 优先 搜索 算法 在 图 23.3 所 示 的 无 向 图 上 运行 的 结果 ， 用 顶点 作为 源 点 。 

23.2-3 如 果 对 过 程 BFS 进行 修改 以 处 理 输入 男 为 邻接 矩阵 的 情况 ， 那 么 该 算法 的 运行 时 间 如 何 ? 

23.2-4 试 证 明 在 宽 这 优先 搜索 中 ， 赋 给 结 点 u 的 值 d[uj 和 结 点 在 六 接 表 中 的 次 序 无 关 . 

23.2-“5 举例 说 明 ， 在 有 向 图 人 =(V,E) 中 ， 源 结 点 sE V， 且 树枝 集合 E_=E 满足 ， 对 每 一 结 点 YE 
VY，PBx 中 从 s 到 v 的 唯一 路 乱 是 G 的 一 条 最 短路 径 ， 然 而 不 论 在 每 个 邻接 表 中 各 结 点 如 何 排列 ， 不 能 通过 
在 所 上 运行 BFS 而 产生 边 集 王 。 

23.2-6 ”给 出 一 有 效 算 法 以 确定 某 一 无 向 图 是 否 是 侦 国 . 


23.2-7 树 工 -(VB) 的 直径 定义 为 max5(uv)， 即 树 的 直径 是 树 中 所 有 最 姑 路 各 长 度 中 前 最 大 值 。 试 写 


出 计算 树 的 直径 的 有 效 算 法 并 分 析 算 法 的 运行 时 间 。 
路 径 在 每 个 方向 上 仅 通过 B 中 的 每 条 边 一 次 ， 


23.3-1 画 一 个 3x3 的 图 ， 行 和 列 分 别 标 上 白 、 藉 、 暴 。 对 每 个 单元 (四 ， 试 浇 明 在 对 一 有 向 图 进行 
深度 优先 搜索 的 任何 时 刻 , 是 否 可 能 存在 一 条 边 从 颜色 为 i 的 顶点 到 颜色 为 j 的 顶点 的 边 ， 对 无 向 图 的 情形 
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也 问 样 师 疼 说 明之 ， . 
432 说 明 深 度 优 先 搜 索 在 图 23.6 所 示 的 图 上 如何 进行 。 仍 定 DRFS 过 程 的 第 $-7 行 循 环 按 字 世 表 ， 
髓 序 选 莘 乡 点, 并 假定 每 个 邻接 表 中 的 结 点 均 按 党 幅 表 排序 。 试 写 贞 每 个 结 点 的 发 现 和 党 成 时 刻 以 及 每 条 
边 的 类 别 。 
23.3-3 底 与 出 图 23.4 所 示 的 深度 优先 搜 寄 的 括 导 钳 构 . 
23.3- 持 试 证 明基 一 - 荣 边 tu: 
a. 是 树 较 或 正 向 边 当 再 人 避 节 diul<drvj<ife]< fa 
b. 是 反 商 这 当 匡 各 当 dy] < 由 u<fru< 人 fj 
,是 获 各 过 当 且 促 当 本]<fei<dtu] fo] 
3 一 试 谨 明 在 无 向 必 中， 根据 深度 优先 搜索 阁 先 调 到 竟 吓 过 fa-y} 还 惩 (ea 次 定 边 fuw) 是 树枝 还 是 
忌 岂 过 等 价 二 在 分 类 方 沈 由 根据 类 型 的 优先 级 来 分 类， 
23.3-6 给 出 一 个 皮 例 来 说 明 下 列 铺 想 不 威 立 : 在 有 向 赂 站 中 如 果 存 在 -- 条 从 下 到 v 的 通路 ， 旧 对 总 
进行 深 庶 优先 搜索 时 有 doj< dvl， 刺 在 搜索 产生 的 深度 优先 森林 中 旺 u 的 后 商 . 
23.3-7 试 修改 深度 优先 搜索 的 过 程 ， 使 得 算法 能 够 择 印 出 有 向 禹 G 的 每 条 边 及 其 类 型 ， 游 怠 是 无 向 
图 算法 尺 如 何 履 改 ? 
23.3-8 试 说 明 对 有 向 历 的 基 一 头 点 u， 虽 然 由 有 以 为 起 点 的 边 也 有 以 于 为 辫 点 的 边 ， 但 结 点 理 仍 
- 然 签 正 宁 仅 含 有 nu 的 深度 优先 竺 。 - 
23.3-9 说 明 对 恩 向 图 台 进行 深度 优先 搜索 可 下 来 识 缠 局 的 迷 通 支 ， 日 如 的 深度 优先 森林 所 包 舍 的 “ 
树 的 数 订 就 是 G 的 连通 支 数 ， 要 求 修改 译 底 优 先 搜索 算法 ， 给 每 个 结 点 作 一 个 烛 型 标号 cc[v]， 其 值 为 直到 
kk. 为 丘 的 连通 支 数 ， 放 使 修改 后 的 算法 满足 ccfu] = eety] 当 且 仅 当 和 在 周 -- 连 通 支 中 。 
3343 上 0 * 在 有 向 周 G=(V,E) 申 ， 对 任意 结 点 ww vEV， 若 以 uv 袁 示 从 环 到 至 包 只 有 一 条 简 
单 路 宅 ， 刚 图 局 称 为 单 连 通 图 . 远 写 出 一 有 效 算 法 以 确定 一 有 向 图 是否 为 单 连 通 图 ， 


24.4 1 . 与 出 竹 法 TOPOLOGICAL~SORT 在 图 23.8 所 示 的 图 上 运行 后 所 尘 成 的 结 点 庆 列 ， 


日 





疼 23.8 可 进行 岳 扑 排序 的 一 个 有 向 无 回路 几 


23.4-2 对 有 向 阅 G 进行 拓扑 排序 可 得 到 很 多 不 同 的 结 点 序列 。 篆 法 TOPOLOGICAL_SORT 所 疡 
生 的 并 列 中 ， 结 点 骇 序 和 结 点 在 深度 优先 搜索 中 的 完成 时 刻 顺 序 相 反 。 证 明 并 非 所 有 的 拓扑 序列 都 能 用 这 
种 方法 获得 ， 即 存在 这 样 的 图 G， 不 论 其 邻接 表 结构 如 何 ， 存 在 的 一 拓扑 序列 不 能 由 算法 
IOROLOGICAL-SORT 生成 。 另 外 证 明 存在 这 样 的 图 ， 对 该 图 两 种 不 同 的 侣 接 表 表示 却 可 产生 相关 的 拓 
扑 排 序 。 

234 3 试 号 出 一 算法 以 靖 定 一 已 馈 无 局 疼 各 =(VE) 电 和 否 包含 加 路、 算法 的 运行 时 间 应 为 O(V)， 和 
ji 此 关 。 

2344 涯 某 有 向 赂 台 包 含 回路 ， 则 TOPODELOGICAEL-SORT(G) 和 将 后 成 一 个 * 坏 * 按 数目 最 少 的 结 点 
厚 列 ( 杯 边 是 指 和 生成 序 绚 方向 不 一 至 的 边 )。 这 种 说 法 是 否 正确 ? 试 判 定 并 作证 明 ， 

妇 3.4 5 对 有 向 无 本 路 周 扣 = (V,E]) 进 行 拓扑 排序 的 另 一 种 方法 是 反复 寻找 人 度 为 0 的 结 点 ， 输 出 找到 
的 结 点 后 ， 从 图 中 去掉 它 及 中 它 出 发 的 所 有 边 。 试 说 明 如 何 实现 该 思想 并 使 相 庶 算法 的 运行 时 间 为 
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OtV+E)。 若 避 中 有 回路 则 该 算法 会 遇 到 什么 问题 ? 


23.5-~]1 车 给 某 昼 增加 一 条 边 ， 其 强 连 通 支 的 数目 将 如 何 变化 ? 

23.5-2 说 明 过 程 STRONGLY-CONNECTED-COMPONENTS 是 如 何在 图 23.6 所 示 的 图 上 运行 . 
的 ， 并 特别 说 明 第 一 行 中 标 出 的 完成 时 刻 和 第 三 行 所 生成 的 木林， 假定 在 第 和 7 行 的 循环 中 ，DEFS 按 字 母 
囊 顺 序 考察 各 结 点 ， 且 邻接 表 中 的 结 点 也 按 字母 表 排序 ， 

23.5-3 ” 某 人 声称 可 以 简化 计算 强 连 通 支 的 算法 ， 邑 在 第 2 次 深度 优先 搜索 中 采用 初始 图 (条 不 是 它 的 
转 置 ) 并 且 按 完成 时 刻 递 增 的 次 译 来 扫描 各 结 点 ，, 他 的 说 法 是 否 正 确 ? 

23.5-4 ”现在 我 们 来 定义 图 驯 =(VY， 了 瑟 的 分 支 图 GS = (VSC，ESCOJ， 其 中 Vscc 包含 的 每 一 个 结 点 对 
应 于 台 的 每 个 强 连 通 支 。 如 果 图 台 的 对 应 于 铺 点 翌 的 强 连通 支 中 ， 某 个 结 点 和 对 庶 于 v 的 强 连 通 支 中 的 革 
个 结 点 之 间 存 在 一 有 向 边 。 则 边 和 加， 内 和 BE8CS， 转 23.9(g 给 出 了 一 个 实例 ， 证 明 Gscc 是 一 有 向 无 加 路 图 ， 

23.5-5 写 出 一 时 间 复 杂 性 为 DO(V+E) 的 算法 来 计算 有 向 图 G=(V，E) 的 分 支 图。 则 给 出 的 算法 计 和 工 
出 的 分 支 图 中 的 每 两 个 结 点 间 至 多 只 存在 一 条 边 ， 

23.5-6 已 知 一 有 向 图 台 =(V，E)， 试 说 明 如 何 建立 另 一 个 图 G =(Y，E7) 以 满足 如 下 条 件 : (a)G2 和 
对 有著 相同 的 强 连 通 支 ; (b)G“ 和 局 有 相同 的 分 支 图 ; (cjE' 尽 可 能 小 。 写 出 一 快速 算法 来 计算 局 /， 

23.5-7 ” 称 有 向 图 台 =(V，E) 为 半 连 通 图 ， 如 果 对 任意 结 点 Bu，vEV 有 um vv 或 v_ ua 写 出 一 月 效 算 
法 以 确定 图 如 是 后 是 半 连 通 人 图。 证 明 算 法 的 正确 性 并 分 析 其 运行 时 间 ， 
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第 一 十 四 章 “最 小 生成 树 


在 设计 电子 线路 时 ， 党 党 要 把 数 个 元 件 的 引 胸 连 在 起， 使 其 电位 相同 . 要 使 几 个 引 脚 
瑟 相 连通 ， 可 以 使 用 mn- 条 接线 ， 每 条 接线 连接 两 个 引 肝 。 沁 楼 方法 很 多 ， 通 党 需要 扫 出 接 
线 最 少 的 接 法 。 

我 们 可 以 扰 这 _ 按 线 问 题 模 列 化 为 一 无 向 图 G-(V， 可 ， 其 中 立 是 引 朋 集合 , 五 是 每 ， 
对 引 脚 间 可 能 存在 的 接线 集合 ， 对 图 中 每 一 边 (0，wEE， 有 一 个 权 值 wu，y) 来 表示 连接 
和 v 的 代价 (需要 的 接线 数目 )。 我 们 希望 找 出 一 元 回路 子 集 TEE， 使 其 连接 所 有 结 点 , 且 


其 权 值 之 和 w( 了 =  wtn， 有 为 最 小 。 因为 T 无 回路 且 连 接 了 所 有 结 点 ， 所 以 它 必 然 是 一 


teT 


棵 树 ， 我 们 称 之 为 生成 树 。 把 确定 树 了 的 问题 称 为 最 小 生成 树 问题 。 图 24:1 说 明了 一 -个 连 
通 图 及 其 最 小 生成 树 的 实例 。 图 中 标示 了 各 边 的 权 ， 阴 影 覆盖 的 边 为 最 小 生成 树 包 含 的 边 ， 
树 中 各 边 的 权 值 之 和 为 37。 最 小 生成 树 并 不 是 唯一 的 : 用 边 (a，bh) 替代 边 (b，c) 后 就 
得 到 另外 一 棵 最 小 生成 树 ， 其 中 各 边 的 权 之 和 也 是 37。 


<- 归 





狠 24.1 连通 图 的 生 小 生成 本 


”在 本 章 中 ， 我 们 将 阐述 解决 最 小 生成 树 问 题 的 两 种 算法 : Kruskal 1 算法 和 Prim 算法 . 
这 两 个 算法 中 都 使 用 了 堆 ， 运行 时 间 均 为 Q(E lg V)。 通 过 采用 .Fibonacci 堆 ，Prim 算法 的 运 
行 时 间 可 以 减少 到 OU(EHTV1g V)， 若 [V| 远 小 于 划 |， 这 将 是 对 算法 的 较 大 改进 。. 

这 两 个 算法 还 说 明了 解决 称 为 * 货 心 * 策 略 的 最 优化 问题 的 启发 式 技术 ， 在 算法 的 每 一 步 
都 必须 对 几 种 可 能 性 作出 选择 。 贪心 策略 提倡 作出 当前 最 优 的 选择 。 这 种 策略 并 不 能 保证 能 ， 
找 出 就 全 局 来 说 最 令 人 满意 的 解决 办 法 。 对 于 最 小 生成 树 问 题 来 说 ， 我 们 却 可 以 证 明 贪 心 策 
赂 确实 可 获得 具有 最 小 权 值 的 生成 树 ，。 贪 心 策略 已 在 第 十 七 章 作 了 详细 探讨 。 读 者 无 需 先 读 
十 七 章 ， 但 实际 上 本 章 所 述 的 食 心 方法 是 前 面 所 介绍 的 理论 的 经 典 应 用 实例 。 

第 24.1 节 介 绍 了 一 般 的 最 小 生成 树 的 算法 ， 该 算法 每 次 加 人 一 条 边 来 逐渐 形成 一 标 生 
成 树 。 第 24.2 节 中 说 明了 实现 上 述 一 般 算法 的 两 种 途径 。 第 一 种 算法 即 玉 rushal 算法 类 似 
于 22.4 节 中 的 连通 支 算法 。 另 一 种 算法 即 Prim 算法 类 似 于 第 24.2 节 中 讨论 的 Dijkstta 最 
短 通路 算法 。 
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24.1 屋 小 生成 树 的 形成 


候 设 已 知 一 无 向 连通 加 GG=(V， B)， 其 加 权 函 数 为 w: E~>R， 我 们 希望 找到 图 台 的 最 
小 生成 树 。 本章 所 讨论 的 两 种 算法 都 运用 了 贫 心 方法 ， 但 在 如 何 运用 贪心 法 上 却 有 所 不 同 。 
下 列 的 “一 般 " 算 法 正 是 采用 了 贪心 策略 ， 每 步 形 成 最 小 生成 树 的 一 条 边 。 竺 法 设置 了 集 
合 A， 该 集合 一 直 是 某 最 小 生成 树 的 子 集 . 在 每 步 决 定 是 否 把 边 心 ， 妇 添加 到 集合 AA 中 ， 
其 汪 加 条 件 是 AUtu，vyjj 仍然 是 最 小 生成 树 的 子 集 ， 我 们 称 这 样 的 边 为 A 的 安全 边 ， 因 为 
可 以 安全 地 把 它 添 加 到 A 中 而 不 会 玻 坏 上 述 条 件 。 
CENERICMSTCG， 了 ， 
1. 点 -一 看 
2 while A 没有 形成 一 牺 生成 树 
3， do 拷 出 各 的 一 条 安全 边 {fu: 7 
本 AAA 
3， jetufn 名 
注意 从 第 1 行 以 后 ， A 显然 满足 最 小 生成 树 子 集 的 条 件 ， 第 2 一 4 行 的 往 环 中 保持 着 这 _ 
条 件 ， 当 第 5 行 中 返回 集合 A 时 ，A 就 必然 是 一 最 小 生成 树 ， 敌 法 最 棘手 的 部 分 自然 是 第 
3 行 的 寻找 安全 边 。 必 定 存 在 一 生成 树 ， 因为 在 执行 第 3 行 代码 时 ， 根据 条 件 要 求 存在 一 生 
成 树 T， 使 ASET， 且 若 存在 边 (u，mET 旦 人 ，vj 兴 A， 则 (0， 曙 是 A 的 安全 边 。 
在 本 节 的 余下 部 分 中 ， 我 们 将 提出 一 条 确认 安全 边 的 规则 (定理 24.1)》， 下 一 节 我 们 将 具 
全 讨论 二 用 这 规则 寻找 安全 边 的 两 个 有 效 的 算法 : 1 





- 国 24.2 人 丙种 迁 径 玉 玫 2 所 未 村 的 宙 (S，V 一 5 


首先 我 们 来 定义 几 个 概念 . 有 向 图 G=(V， BE) 的 割 ($, V-S) 是 YV 的 一 个 分 划 ， 当 _ 条 这 
,VEE 的 一 个 端点 属于 $ 而 另 一 端点 属于 V--S, 则 我 们 说 边 (u, v) 通 过 制 (S, VS)， 车 集 合 
A 中 没有 边 通 过 制 , 则 我 们 说 割 不 妨害 边 的 集合 A。 如 果 茶 边 是 通过 制 的 具有 最 小 权 值 的 边 ， 


一 343 一 


则 称 该 边 为 通过 割 的 一 条 轻 边 。 要 注意 在 链 路 的 情况 下 可 能 有 多 条 轻 边 。 从 更 一 般 意义 来 讲 
, 如 果 一 条 边 是 满足 某 一 性 质 的 所 有 边 中 具有 最 小 权 值 的 边 , 我 们 就 称 该 边 为 计 足 该 性 质 的 
一 条 轻 边 。 图 24.2 说 明了 这 些 概 念 。 (a) 集合 $ 中 的 结 点 为 黑色 结 点 , V-S 中 的 那些 结 点 为 
白色 结 点 。 连接 白 色 和 时 色 结 点 的 那些 边 为 通过 该 割 的 边 。 边 (d, ec) 为 通过 该 割 的 唯一 一 
条 轻 边 。 子 集 & 包含 阴影 覆盖 的 那些 边 , 注意 , 由 于 A 中 没有 按 通 过 割 ， 所 以 割 〈S$ V-S) 
不 妨害 A。 (b) 对 于 同一 张 图 , 我 们 招集 合 $ 中 的 结 点 放 在 图 的 左边 , 集 人 台 V-8 中 的 缚 点 族 
在 图 的 布 边 。 如 果 某 条 边 使 左边 的 顶点 与 右边 的 顶点 相连 则 我 们 说 该 边 通 过 谭 。 

确认 安全 边 的 规则 由 下 列 定理 给 出 。 

定理 24.1 设 图 G(V， 马 是 一 无 向 连通 图 ， 且 在 卫 上 定义 了 相应 的 实数 值 加 权 函 数 
w， 设 A 是 了 的 一 个 子 集 且 包 含 于 G 的 某 个 最 小 生成 树 中 ， 制 ($，V-S) 是 G 的 不 妨害 A 
的 任意 割 且 边 (u， 允 是 穿 过 割 ($，V-Sjb 的 一 条 轻 边 , 则 边 (u， 妇 对 集合 A 是 安全 的 。 

证 明 : 设 人 下 是 包含 A 的 一 最 小 生成 树 ， 并 假定 工 不 包 售 轻 边 人 na， 妇 ， 因 为 若 包含 就 完 
成 证 明了 。 我 们 将 运用 “ 戎 贴 技术 "(cut-and-paste technique) 建 立 另 一 棵 包含 AL Ha， 夺 
的 最 小 生成 树 下 ， 并 进而 证 明 (u， 亿 对 A 是 一 条 安全 连 ， 





图 24.3 定理 24.1 的 证 明 


图 24.3 示 出 了 定理 24.1 的 证 明 。$S 中 的 缚 点 为 黑色 , V-S 中 的 结 点 为 白色 边 (u y) 与 开 
中 各 到 的 通路 P 中 的 边 构成 一 回路 。 由 于 和 v 处 于 割 (S, V 一 S) 的 相对 的 边 上 , 因此 在 
T 中 的 通路 P 上 至 少 存在 一 条 边 也 通过 制 。 设 (zx, 刀 为 满足 此 条 件 的 边 。 因 为 割 不 妨害 A, 所 
以 边 (, 凡 不 属于 和 A。 叉 因为 代 , 处 于 工 中 从 习 到 Y 的 唯一 通路 上 , 所 以 去 掉 按 (K， 妨 就 会 把 ， 
T 分 成 两 个 子 图 。 这 时 胡 入 边 (u, 妇 以 形成 一 新 的 生成 树 下 =T-f(x, 咏 ]Lfu 

下 一 步 我 们 证 明 了 T 是 一 棵 最 小 生成 树 。 因 为 (u。 由 是 通过 割 (，V-S) 的 一 条 轻 边 且 边 
(x， 愉 也 通过 割 ， 所 以 有 w(u， 妇 委 w(Gx， 妨 ， 因 此 

wT=w(TD-wC，7Hw ms<swT) 

但 工 是 最 小 生成 桂 ， 所 以 w( 近 W4T 0) 因此 T 必定 了 是 最 小 生成 本， 

现在 还 要 证 明 心 ， 由 实际 上 是 A 的 安全 边 。 由 于 ASET 且 {x，yY)g A， 所 以 有 AGET， 
则 AUjf@， 中 ET。 而 节 是 最 小 生成 树 ， 因 而 人 o， 归 对 A 是 安全 的 (证 毕 )。 

定理 24.1 使 我 们 可 以 更 好 地 了 解 算法 GENERIC-MST 在 连通 图 台 =(V， 了 上 的 执行 
流程 。 在 算法 执行 过 程 中 ， 祭 合 A 始终 是 无 回路 的 ， 否 则 包含 A 的 最 小 生成 树 包 含 一 个 
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环 ， 这 是 不 可 能 的 。 在 算法 执行 中 的 任何 一 时 刻 ， 图 GA= (V，A) 是 一 森林 且 GA 的 每 一 连 
通 支 均 为 树 。( 其 中 某 些 树 可 能 只 包含 一 个 结 点 ， 例 如 在 算法 开始 时 ，A 为 空 集 ， 森 林 中 包 
含 |V| 棵 树 ， 每 个 顶点 对 应 一 棵 树 )， 此 外 ， 对 .A 安全 的 任何 边 (a， 如 都 连接 GA 中 不 同 的 连 
通 支 ， 这 是 由 于 Al ftu， 可 jj 必定 不 包含 回路 。 

随 着 景 小 生成 树 的 |V|~1 条 边 相继 被 确定 ，GENERIC-MST 中 第 2-4 行 的 循环 也 随 之 
要 执行 [VI-1 次 。 初 始 状态 下 ，A = 和 由，GA 中 有 |Y| 棵 树 ， 每 个 选 代 过 程 均 将 减少 一 棵 树 ， 当 
森林 中 只 包含 一 棵 树 时 ， 算 法 执行 终 灶 。 

第 24.2 节 中 论述 的 两 种 算法 均 使 用 了 下 列 定理 24.1 的 推论 . 

推论 24.2 设 G=(V，B) 是 一 无 向 连通 图 ， 且 在 E 上 定义 了 相应 的 实数 值 加 权 函 数 
w， 设 A 是 了 的 子 集 且 包 售 于 台 的 某 最 小 生成 树 中 ，C 为 森林 GA = (V，A) 中 的 连通 支 ( 树 )。 
”车 边 (a， 愉 是 连接 C 和 GA 中 其 他 某 连 通 支 的 一 轻 边 ， 则 边 (a， 内 对 集合 A 是 安全 的 。 
证 明 : 因为 审 (C，V-C) 不 妨害 A， 央 此 (u， 了 是 该 割 的 一 条 轻 边 。( 证 毕 ) 


24.2 Kruskal 算法 和 Prim 算法 


本 节 扩 峭 述 的 丙种 最 小 生成 树 算法 是 上 节 所 介绍 的 一 般 算 法 的 风化 。 每 个 算法 均 采 用 一 
特定 规则 来 确定 GENERIC-MST 算法 第 3 行 所 描述 的 安全 边 。 在 Kruskal 算法 中 ， 集 合 
A 是 一 森林 ， 加 人 集合 A 中 的 安全 边 总 是 图 中 连结 两 不 同 连通 支 的 最 小 权 边 。 在 Prim 算法 
中 ， 和 集合 A 仅 形 成 单 棵 树 。 涨 加 人 集合 A 的 安全 边 总 是 连结 树 与 一 非 树 结 点 的 最 小 权 边 。 


Kruskal 算法 


Kruskal 算法 是 直接 基于 第 24.1 节 中 给 出 的 一 般 最 小 生成 树 算法 的 基础 之 上 的 。 该 算法 
找 出 森林 中 连结 任意 两 棵 树 的 所 有 边 中 具有 最 小 权 值 的 边 {u， 人 作为 安全 边 ， 并 把 它 漆 加 到 
正在 生长 的 森林 中 。 设 C, 和 C, 表示 边 人 n， 允 连结 的 两 棵 树 。 因 为 (u， 妇 必 是 连结 C, 和 其 
他 某 棵 树 的 一 条 轻 边 ， 所 以 由 推论 24.2 可 知 (u， 妇 对 Ci 是 安全 边 。Kruskal 算法 同时 也 是 
一 种 贪心 算法 ， 因 为 算法 每 一 步 添加 到 森林 中 的 边 的 权 值 都 尽 可 能 小 ， 
Kruskal 算法 的 实现 类 似 于 第 22.1 节 中 计算 连通 支 的 算法 。 它 使 用 了 分 离 集合 数据 结构 
以 保持 数 个 互相 分 离 的 元 素 集 合 .。 每 一 集合 包含 当前 森林 中 某 个 树 的 结 点 ， 操 作 
FIND-SET(o 返 回 包含 u 的 集 含 中 的 一 个 代表 元 素 ， 因 此 我 们 可 以 通过 测试 
FIND-SET(o) 是 否 等 同 于 FIND-SET(V) 来 确定 两 结 点 u 和 是 否 属于 同一 棵 树 ， 通 过 过 
_ 程 UNION 来 完成 树 与 树 的 连结 。 
MST--KRUSKAELG，W) 
二 < 币 
fotr 每 个 乡 点 YY[] 
do MAEE 一 SETLY) 
栓 据 权 六 的 非 遂 减 贿 序 对 了 的 边 进行 排序 
， fior 簿 条 地 和 @， 妇 和 EE， 按 入 的 非 递减 次 序 
do 让 FIND-SETIu) - 夫 FIND 一 SETIv) 
then A< AL Hu，VY 
UNION(uw， 人 他 


名 
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。 史 return 矶 


了 ruskal 算法 的 工作 流程 如 图 24.4 所 示 。 阴 影 覆盖 的 边 属 于 正在 生成 的 森林 A。 竺 法 按 

权 的 大 小 顺序 考察 各 边 。 箭 头 指向 算法 每 一 步 所 考察 到 的 边 。 第 1]--3 行 初始 化 集合 A 为 空 

集 并 建立 |VI 棵 树 ， 每 标 树 包含 图 的 一 个 结 点 。 在 第 4 行 中 根据 其 权 值 非 递 减 次 序 对 王 的 边 

进行 排序 。 在 第 5-8 行 的 for 循环 中 首先 检查 对 每 条 边 (。 忆 其 端点 u 和 是 否 属于 同一 棵 

树 。 如 果 是 ， 则 把 (au， 癌 加 人 森林 就 会 形成 一 回路 ， 所 以 这 时 放弃 边 (u， 下 )。 如 果 不 是 ， 则 

. 两 结 点 分 属 不 同 的 树 ， 由 第 ?7 行 把 边 加 入 集合 A 中 ， 第 8 行 对 两 棵 树 中 的 结 点 进行 归并 。 





图 24.4 Kmskal 竺 法 在 图 24.1 所 孙 的 图 上 的 执行 流程 


下 tuskal 算法 在 图 G=(V， 了 世上 的 运行 时 间 取 决 于 分 离 集合 这 一 数据 结构 如 何 实现 。 我 
们 采用 第 22.3 节 中 所 述 的 按 行 结合 和 通路 压缩 的 启发 式 方法 来 实现 分 离 集合 森林 的 结构 ， 
这 是 由 于 从 渐 近 意义 上 来 说 ， 这 是 目前 所 知 的 最 快 的 实现 方法 。 初 始 化 需 占用 时 间 O(V)， 
第 4 行 中 对 边 进行 排序 需要 的 运行 时 间 为 O(E lg B); 对 分 离 集 的 森林 要 进行 O(BE) 次 操作 ， 

”总 共 需 要 时 间 为 OU(Ea(E，YV))， 其 中 e 函数 为 第 22.4 节 中 定义 的 Ackermann 函数 的 反 函 
数 。 因 为 KE， 刀 =OUg 本 ， 所 以 及 ruskal 算法 的 全 部 运行 时 间 为 OBE IE)。 
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as， 


正如 到 ruskal 算法 一 样 ，Piim 算法 也 是 第 24.1 节 中 讨论 的 一 般 最 小 生成 树 算法 的 特 
例 。Prim 算法 的 执行 非常 类 似 于 寻找 图 的 最 短 通路 的 Dijkstra 算法 ( 详 见 第 25.2 节 )。Prim 
算法 的 特点 是 集合 A 中 的 边 总 是 只 形成 单 棵 树 。 如 图 24.5 所 示 ， 阴 影 覆 盖 的 边 属于 焉 在 生 
-成 的 树 ， 树 中 的 结 点 为 黑色 。 在 算法 的 每 一 步 ， 树 中 的 结 点 确定 了 图 的 一 个 制 ， 并 且 通 过 该 
割 的 轻 边 被 加 进 树 中 。 检 从 任 意 根 结 点 5 开始 形成 并 逐渐 生长 直至 该 树 跨越 了 V 中 的 所 有 
结 点 。 在 每 一 步 ， 连 接 A 中 某 结 点 到 V-A 中 某 结 点 的 轻 边 被 加 入 到 树 中 。 由 推论 242， 该 
规则 仅 加 人 对 A 安全 的 边 ， 因 此 当 算 法 徐 止 时 ，A 中 的 边 就 成 为 一 棵 最 小 生成 树 。 因 为 每 
次 添加 到 树 中 的 边 都 是 使 树 的 权 尽 可 能 小 的 边 ， 因 此 上 述 策略 也 是 “ 贫 心 "的 。 
-有效 实现 Prim 算法 的 关键 是 设法 较 和 容易 地 选择 一 条 新 的 边 添 加 到 由 A 的 边 所 形成 的 树 
中 ， 在 下 面 的 伪 代 码 中 , 算法 的 输入 是 连通 图 G 和 将 生成 的 最 小 生成 树 的 根 r。 在 竺 法 执行 
过 程 中 ， 不 在 树 中 的 所 有 结 点 都 驻 留 于 优先 级 基于 key 域 的 队列 Q 中 。 对 每 个 结 点 vkey[v] 
是 连接 v 到 树 中 结 点 的 边 所 具有 的 最 小 权 值 , 按 常规 , 若 不 存在 这 样 的 边 则 key[vj=ce。 域 
r[y] 说 明 树 中 v 的 * 父 母 "。 在 算法 执行 中 , GENERIC-MST 的 集合 A 隐 含 地 满足 : 
A= fw，r[m vcEV1-O) 和 
当 算 法 终止 时 ， 优 先 队 列 Q 为 空 ， 因 此 G 的 最 小 生成 树 A 满足 : 
和 ={v，z[D: vEV 一 人 
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图 24.5 ”Prim 算法 在 图 24.1 





所 示 的 图 上 的 执行 流程 


MST-PRIM{(G，w， 中 


Q< VIG] 


1， 


fer 每 个 ago 


2. 


do key[u<*-2 


4 Key[rl--0 


3 了 3. 


fj-MNIL 
6 While 所 款 息 


仿 
本 
对 
忆 部 
2 
名 - 
吧 避 
上 谎 吉 
呈 一 
全 
中 
[地 
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9. 旭 lo 这 vandwtu，v<key[v] 
W. ARARRSAN 
] 了 = er utfay- 了 雪 


Prim 算法 的 工作 流程 如 图 24.5 所 了 示 。 第 1~4 行 初始 化 优先 队列 吕 使 其 包含 所 有 结 点 ， 
署 每 个 结 点 的 key 域 为 ce( 除 根 工 以 外 ])，[ 的 key 域 被 路 为 0 第 5 行 初 始 化 fr] 的 值 为 
NIL， 这 是 由 于 + 没有 父母 。 在 整个 算法 中 ， 集 合 V~Q 包含 正在 生长 的 树 中 的 结 点 。 第 了 
行 识 别 出 与 通过 制 (V~Q， 包 的 一 条 轻 边 相关 联 的 缚 点 uE Q( 第 一 次 选 代 例外 ， 根 据 第 4 行 
这 时 mu=D。 从 集合 Q 中 去 掉 _ 后 把 它 加 和 人 到 树 的 结 点 集合 V-Q 中 。 第 8--11 行 对 与 恬 令 
接 且 不 在 树 中 的 每 个 结 点 v 的 key 域 和 域 进 行 更 新 ， 这 样 的 更 新 保证 key[v]= wtv，zriv) 
且 (v， 训 是 连接 v 到 树 中 某 结 点 的 一 条 轻 边 。 

Prim 算法 的 性 能 取决 于 我 们 如 何 实现 优先 队列 Q。 若 用 二 入 堆 来 实现 总 (上 见 第 七 章 )， 
我 们 可 以 使 用 过 程 BUILD-HEAP 来 实现 第 1-4 行 的 初始 化 部 分 ， 其 运行 时 间 为 D(V)。 御 
环 需 执行 | 则 次 ， 且 由 于 每 次 EXIRACT-MIN 操作 需 孙 OUlg V) 的 时 间 ， 所 以 对 了 X- 
TRACT-MIN 的 全 部 调用 所 占用 的 时 间 为 O(V lg V)。 第 8-11 行 的 fer 循环 总 共 要 执行 
OBE) 次 ， 这 是 因为 所 有 邻接 表 的 长 度 和 为 3EI|。 在 for 循环 内 部 ， 第 9 行 对 队列 忆 的 成 员 条 . 
件 进行 测试 可 以 在 常数 时 间 内 完成 ， 这 是 由 于 我 们 可 以 为 每 个 结 点 空 出 1 位 (bib 的 空间 来 记 
录 该 结 点 是 否 在 队列 QQ 中 , 并 在 该 结 点 被 移出 趴 列 时 随时 对 该 位 进行 更 新 。 第 11 行 的 赋值 
谱 和 句 隐 全 一 个 对 堆 进 行 的 DECREASE-KEY 操作 ， 该 操作 在 堆 上 可 用 OUdg V) 的 时 间 完 
成 。 因 此 ，Prim 算法 的 整个 运行 时 间 为 DO(V lg VTEIgV=OE 这 V)， 从 渐 近 意义 上 来 说 ， 
它 和 实现 政 ruskal 算法 的 运行 时 间 相 同 。 . 

通过 使 用 Fibonacci 堆 ，Prim 算法 的 渐 近 意义 上 的 运行 时 间 可 得 到 改进 。 在 第 二 十 一 
章 中 我 们 已 经 说 明 ， 如 果 | 如 个 元 素 被 组 织 成 Fibonacci 堆 ， 可 以 在 Oftg 允 ) 的 平 摊 时 间 内 究 
成 EXTRACT-MIN 操作 , 在 OU) 的 平 捧 时 间 里 完成 DECREASE-KEY 操作 (为 实现 第 
i1 行 的 代码 )， 因 此 ， 若 我 们 用 Fibonacci 堆 来 实现 优先 队列 QQ，Prim 算法 的 运行 时 间 可 以 
改进 为 DGE+V 地 V)。 


思 考 题 


24-1 次 最 小 生成 树 


设 G=(V,- E) 是 一 无 向 连通 图 , 在 其 上 定义 了 研 权 函数 w: E-~> 及 ， 假 设 I 昌 | 兰 |W1 

a. 设 工 是 怠 的 一 模 最 小 生成 树 ， 证 明 存 在 边 人 u，ET 和 (xx，y)k T， 满 足下 列 条 件 : 
Ta、 ， 别 是 G 的 一 棵 次 最 小 生成 树 。 

b. 设 了 是 G 的 一 棵 生成 树 ， 且 对 任意 两 结 点 uvEYV， 设 max[u，Yj 是 工 中 心 和 YY 之 
闻 的 唯一 通路 上 的 具有 最 大 权 值 的 边 。 描 述 一 运行 时 间 为 D(V 沁 的 算法 ， 对 于 给 定 的 T 和 所 
有 缚 点 uvEV， 该 算法 可 计算 出 相应 的 maxfu，v]。 

c. 写 出 一 有 效 算 法 计算 出 局 的 次 最 小 生成 树 。 
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24-2 ” 稀 琉 图 的 最 小 生成 树 


对 一 个 非常 稀 酸 的 连通 图 G= (V， 匡 ， 我 们 可 以 对 G 进行 “ 预 处 理 *， 以 便 在 运行 Prim ， 
算法 前 减少 结 点 的 数目 ， 这 样 就 能 对 使 用 Fiponacci 堆 的 Prim 算法 的 运行 时 间 OUE+TV ] 
V) 进 行 收 进 。 下 面 的 过 程 以 某 赋 权 图 G 作为 输入 ， 并 加 入 一 些 边 到 正在 构筑 的 最 小 生成 树 
T 中 ， 最 后 返回 图 悟 的 一 个 “ 压 罗 * 图 。 开 始 时 ， 对 每 条 边 (a，wWE E。 人 假设 origlt， 
v]= (u， 尺 且 Wu，yY] 是 过 人 a， 人 的 权 。 

MST-RRDUCE(G， 中 
1 for 每 个 v EV[] 
2 4DO tnark[v<-FEALSR - 
3 MAKERE-SETIv) 
4， for 每 个 EY[] 
5 do 让 mark[u]= FALSE 
右 then 选择 vE Adj[u] 以 重 wmm， 了 为 最 小 
7 
8 


UMNIONOQ， 妇 - 
- TeTU{forig [um， 汗 
9. Iark[a]<-matkfv< 们 RUE 
10.VIGT]={EIND-SET(Iw vCYV[G]} 


ii 了 [后 < 一 修 
12， for eachtx， 放 和 E[G] 
13， do me-FEIND- 一 SET 


14. ve-FIND-~SETIY) 

14. 让 (o，vj# EIG4 和 

16 世 en EEG4]=<-EIGUt，y 

t7， ofgfu，vjeorigfxz， 刀 

18. w[u:v]- 一 wy] 

19， else 讶 ww[x， 了 <wmm，v 

20， then orig[u，vl-orig[fx， 人 习 
21. wu，Yl mw， 习 


22， 椒 涪 名 的 邻 扩 表 Adj 
23， Teturn 心 和 工 
a. 设 工 是 MST-REDUCE 所 返回 的 边 集 ， 了 是 所 返回 的 图 G /的 最 小 生成 树 .。 
证明: 
TLUforig[xz，?: (x，DET) 是 G 的 一 棵 最 小 生成 树 。 
b. 论 证 : IVIG4 入 |W7 2 
“说 明 如 何 实现 MST-REDUCE 以 使 其 运行 时 间 为 O(E)。( 提 示 : 使 用 简单 数据 结构 ) 

d. 假 设 我 们 运行 MST-REDUCE 有 改 个 阶段 ， 在 其 中 一 个 阶段 输出 的 图 作为 下 一 个 阶 
段 的 输入 旦 壹 渐 累 加 边 到 工 中 。 论 证 攻 个 阶 笑 的 整个 运行 时 间 为 DUkE)。 

.假设 在 运行 MST-REDUCE 的 K 阶段 后 ， 我 们 对 最 后 一 个 阶段 所 返 了 册 的 出 运 行 
Prim 算法 。 试 说 明 如 何 选择 玫 以 使 整个 运行 时 间 为 O(E 地 培 W)。 证 明 你 选择 的 故 使 渐 近 
- 意 多 上 的 整个 运行 时 间 为 最 少 . 

f 从 渐 近 意义 上 来 看 ，| 也 为 何 值 (用 |Vl 表 示 ) 可 使 带 预 处 理 的 Prim 算法 超过 不 带 预 处 理 
的 Prim 算法 ? 
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练习 二 十 四 


-24.1-1 ， 设 (ua， 内 是 图 G 的 最 小 权 边 ， 证 明 避 ，V) 属 于 G 的 某 一 最 小 生成 树 。 
24.1-2 有 人 对 定理 24.1 的 逆 命 题 作 如 下 推 独 。 设 G={Y，B) 是 无 向 连通 图 ， 且 在 E 上 定义 了 实 值 加 
权 函 数 友 ， 设 各 为 下 的 子 集 且 生 售 于 避 的 某 最 小 生成 树 中 ， 设 (S，YV-S) 是 不 妨害 A 的 各 的 任意 割 ， 且 
(4u， 人 妇 是 通过 割 人 4，V-S) 的 A 的 安全 边 ， 则 (u， 是 该 抽 的 一 条 轻 边 。 证 明 这 种 推断 是 错误 的 ， 并 举 一 反 饮 
加 以 说 明 。 
”24.1-3 ”证 明 若 边 (u， ) 包 告 于 某 最 小 生成 树 中 ， 则 它 必 是 通过 图 的 某 抽 的 一 条 轻 边 . 
24.1 一 4 试 举 出 一 图 以 满足 如 下 条 御 ， 即 图 中 通过 某 割 的 所 有 轻 边 的 集合 并 不 能 形成 一 棵 最 小 生成 
， 树 。 ” 
24.1-5 设 是 图 G={V，B) 是 某 回路 上 最 大 权 边 。 证明 G'=(Y，E~ 人 9) 中 存在 一 最 小 生成 树 同 时 世 
是 避 的 最 小 生成 树 ， 
24.1-6 证明 如 果 对 图 的 每 一 个 割 均 存 在 唯一 一 的 通过 该 伸 的 轻 边 ， 则 该 柄 有 唯一 的 最 小 生成 树 ， 证 明 
其 逆 命 题 不 成 立 , 并 举 一 反 例 。 
24.14-7 论证 如 果 某 图 的 权 值 均 为 正 ” 则 连接 所 有 结 点 且 权 值 和 为 最 小 的 边 的 集合 必 ,形成 一 标 树 ， 并 
举例 说 明 如 果 人 允许 某 些 权 值 非 正 ， 则 上 述 命题 不 会 成 立 。 
24.1-8 设 T 了 是 图 G 的 最 小 生成 树 , 上 且 工 是 工 中 边 的 权 值 的 排序 表 。 证 明 对 马 的 任意 其 他 最 小 生成 
树 T，E 也 是 世 中 过 的 权 值 的 排序 表 。 
24.1-9 设 工 是 图 G(V，B) 的 一 最 小 生成 树 ， 且 YV' 是 Y 揭 子 集 。 设 站 是 由 V' 推 得 的 T 的 子 图 且 台 ' 是 
由 允 推 得 的 台 的 子 图 ， 证 明 如 果 立 是 连通 的 ， 则 补 是 G? 的 最 小 生成 树 ， 


24.2_1 根据 对 进 进 行 排序 时 所 切断 的 链 路 的 不 同 ， 即 使 对 同一 输 人 图 G，Kruskat 算法 也 可 能 得 出 不 
同 的 生成 树 ， 证 明 对 局 的 每 一 标 最 小 生成 树 T， Kruskal 算法 中 都 存在 一 种 方法 来 对 边 进行 排序 使 得 算法 
”返回 的 最 小 生成 树 为 T。 “ 

24.2-2 假定 图 台 =(VY， 也 用 部 接 符 阵 表示 ， 在 这 种 条 件 下 ， 写 出 一 运行 时 间 为 Ofv23 的 过 程 以 实现 
Prim 算法 ， 

24.2--3 从 源 近 意义 上 来 说 ， 对 于 稀 琉 图 台 = (V， B), 昌 =@(V)， 是 冰 用 Fibonaceci 堆 来 实现 Prim 算 
法 是 否 要 比 用 二 又 堆 来 实现 其 运行 连 度 要 快 ? 苦 对 于 称 审 图 (|BI= 妇 (vV3) 的 情形 又 如 何 ? 从 渐 近 意义 上 来 看 ， 
巴 和 |VI 有 怎样 的 关系 才 会 司 得 用 Fibonacci 堆 比 用 二 允 堆 来 实现 其 算法 执行 起 来 较 快 ? 

24.2-4 搬 设 图 中 所 有 边 的 权 俏 均 为 从 1 到 |W| 的 整数 ， 那 么 能 使 Kruskal 等 法 的 运行 达到 多 快 的 程度 ? 
车 对 某 常量 w， 所 有 边 的 权 值 均 为 从 1 到 w 的 整数 ， 在 这 种 情况 下 又 如 何 ? 

24.2-5 假设 图 中 所 有 和 边 的 权 值 均 为 从 1 到 YI 的 蓝 数 ， 那 么 你 能 使 Prim 算法 的 运行 到 多 快 ?车 对 某 党 
量 w， 所 有 边 的 权 值 交 为 从 1 到 w 的 整数 ， 在 这 种 情况 下 等 法 运行 时 间 如 何 ? 

3242-_6 对 于 某 无 向 图 G， 描 述 一 有 效 算 法 以 生成 图 G 的 生成 树 ， 司 得 该 树 的 边 的 最 大 权 值 是 图 台 的 
所 有 本 成 树 中 最 小 的 。 

4.27 和 假定 某 图 中 按 的 权 值 均匀 分 布 在 半 开 半 闭 区 间 [0，D 上 ， 那 么 及 ruskal 算法 和 Prim 算法 中 
旦 种 可 能 在 此 图 上 更 快 地 运行 ? 

24.2-8* ” 根 定 图 G 有 有 一 棵 已 计算 好 的 最 小 生成 树 ， 如 果 在 图 中 加 和 一 新 结 点 及 其 从 属 的 边 ， 该 最 小 

生成 树 得 到 更 新 最 人 快 需 要 多 少 运行 时 间 ? 
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第 二 十 五 章 单 源 最 短路 径 


乘 汽车 旅行 的 人 总 希望 找 出 到 目的 地 的 尽 可 能 短 的 行程 。 如 果 有 一 张 地 图 并 在 她 图 上 标 
出 了 每 对 十 宇 路 口 之 间 的 荐 离 ， 如 何 找 出 这 一 最 短 行程 ? 

一 种 可 能 的 方法 就 是 枚 举 出 所 有 了 路径 , 并 计算 出 每 条 路 径 的 长 度 , 然后 选择 最 短 的 一 
条 。 那 么 我 们 很 容 易 看 到 ， 即 使 不 考虑 包 舍 回 路 的 路 径 ， 依然 存在 煞 具 月 万 计 的 生生 路 续 ， 
而 其 中 绝 大 多 数 是 不 值得 考虑 的 。 

在 本 章 和 第 二 十 六 章 中 ， 我 们 将 关 明 如 何 有 效 地 解决 这 类 问题 。 在 最 短路 径 问 题 中 ， 给 
出 的 是 一 有 向 加 权 图 已 =(V，E)， 在 其 上 定义 的 加 权 函 数 w: E-~R 为 从 边 到 实 型 权 值 的 映 
射 。 路 径 p= (yo，v，…， 中 的 权 是 指 其 组 成 边 的 所 有 权 值 之 和 : 

wp)= 一 ww Vi) 


定义 从 # 到 v 间 最 短路 径 的 权 为 
5 ={minfwj 车 从 u 到 v 存 在 一 条 通路 
co 否则 

从 结 点 屏 到 结 点 v 的 最 短路 径 定 义 为 权 wp)= 史 ua， 妇 的 任何 路 径 . 

在 滋 车 旅行 倒 中 ， 我 们 可 以 把 公路 地 图 模型 化 为 一 个 图 : 结 点 表示 一 段 会 路 ， 和 边 的 权 表 
示 公 路 的 长 度 。 我 们 的 目标 是 从 起 点 出 发 找 册 一 条 到 达 目 的 地 的 最 短路 径 。 

边 的 权 带 被 解释 为 一 种 度量 方法 ， 而 不 仅仅 是 褒 高 。 它 们 评 带 被 用 来 表示 时 间 、 人 金 俩 ， 
罚款 、 损 和 失 或 任何 其 他 涪 路 径 线性 积累 的 数量 形式 。 

第 23.2 节 中 所 述 的 宽度 优先 搜索 就 是 一 种 在 无 权 图 上 运行 的 最 短路 径 算法 ， 即 在 图 的 
按 都 具有 单位 权 值 的 图 上 的 一 种 算法 。 因 为 有 关 宽 度 优 先 搜索 的 许多 概念 都 产生 于 对 有 权 疼 
的 最 短路 径 的 研究 ， 读 者 可 以 在 继续 学 习 本 章 之 前 复习 一 下 23.2 节 的 内 容 。 


单 源 最 短路 径 问题 的 变形 


在 本 章 中 ， 我 们 将 着 重 讨 论 单 源 最 短路 径 问 题 : 已 知 图 G= (V， 包 ， 我 们 希望 找 出 从 
沫 给 定 源 结 点 8E Y 到 v 中 的 每 个 结 点 的 最 短路 种 ， 很 多 其 他 门 愿 部 可 用 单 源 站 是 的 算法 来 
解决 ， 其 中 包括 下 列 问题 的 变 体 : 

单 目标 最 短路 径 问 题 : 找 出 从 每 一 结 点 到 某 指定 缚 点 则 的 每 条 最 短路 径 。 把 几 中 每 
条 边 的 方向 反 向 ， 我 们 就 可 以 把 这 一 问题 变 为 单 源 最 短路 径 问 题 。 

单 寺 结 点 何 生 短路 径 问 题 。 对 于 某 给 定 结 点 吕 和 找 田 从 到 的 一 条 最 组 路 答 ， 妇 
果 我 们 解决 了 源 结 点 为 u 的 单 源 问 题 ， 则 这 一 问题 也 就 慕 得 了 解决 。 即 使 在 最 坏 的 情况 
下 ， 从 渐 近 意义 上 来 看 ， 目 前 还 没有 比 最 好 的 单 源 算 法 更 快 的 算法 来 解决 这 一 问题 。 

每 对 结 点 间 最 短路 径 问 题 : 对 于 每 对 结 点 u 和 v 找 出 从 u 到 的 最 短路 径 。 我 们 可 以 
用 音源 算法 对 每 个 结 点 作为 源 点 运行 一 次 就 可 以 解决 这 -- 问题 ， 但 通常 可 以 更 快 地 解决 这 一 
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问题 ， 并 且 在 其 正确 性 中 ， 它 的 结构 是 很 值得 注意 的 。 下 一 章 将 详细 讨论 这 个 问题 . 
负 权 边 


在 单 源 最 短路 径 问 题 的 某 些 实例 中 ， 可 能 存在 权 为 负 的 边 。 如 果 图 台 =(V， 了 B) 不 包含 
从 源 s 可 达 的 负 权 于 路 ， 则 对 所 有 vEV， 最 短路 径 的 权 的 定义 &s， 几 依然 正确 ， 即 使 它 是 
一 个 负 值 也 是 如 此 。 但 如 果 存 在 一 从 s 可 达 的 负 权 回路 ， 最 短路 径 的 权 的 定义 就 不 能 成 立 。 
从 s 到 该 国 路 上 的 结 点 就 不 存在 最 短路 径 一 -我们 总 可 以 顺 着 找 出 的 “最 短 ” 路 径 再 穿 过 负 
权 值 回路 从 而 获得 一 权 值 更 小 的 路 径 。 因 此 如 果 从 s 到 v 的 某 路 径 中 存在 一 负 权 回路 ， 我 们 
定义 56(8， 站 = 一 ee。 





图 2s.1 有 了 疝 图 中 进 的 权 汶 负 的 情 堪 


图 25.1 说 明 负 的 权 值 对 最 短路 径 的 权 的 影响 。 每 个 结 点 内 的 数字 是 从 源 结 点 $ 到 该 结 
-点 的 最 短路 径 的 权 。 因 为 从 s 到 aa 只 存在 一 条 路 径 ( 路 径 <s，a>)， 所 以 5(s， 杂 一 wfs， 
到 =3。 类 似 地 ， 从 到 hb 也 只 有 一 条 通路 ， 所 以 Ws，H= ws，ajHafa， 世 = 3H( 下 = 一 ] 
人 共 s 到 c 则 存在 无 数 条 路 径 : <s，c>，<8，c，d，c> ，<8，c，U，c，d，c> 等 等 。 
为 回路 <c，d，c> 的 权 为 6FC3)=3>0， 所 以 从 s 到 = 的 最 短路 径 为 <s，c>， 其 权 为 
5(6，c> =5。 类 做 地， 从 s 到 d 的 最 短路 径 为 <s，c，d>， 其 权 为 5(8， 由 =wfs， 
ciHwtc， 山 =11。 同 样 ， 从 s 到 ee 存在 无 数 条 路 径 : <s，e>，<s，e，f 8e>，<S，e， 
f、，e，f > 等 等 。 由 于 回路 <e， 下 ee> 的 权 为 3+(- 人 =-3<0， 所 以 从 s 到 e 没 有 最 短路 
径 。 只 要 各 越 负 权 回路 任意 次 ， 我 们 就 可 以 发 现 从 s 到 e 的 路 径 可 以 有 任意 小 的 负 权 值 ， 所 
以 6， 日 =- 一。 类 似 地 5(s， 及 = -co。 因 为 多 是 从 f 可 达 的 结 点 ， 我 们 从 s 到 g 的 路 径 可 
以 有 任意 小 的 负 权 值 ， 则 5(s， 叶 = 一。 结 点 h，j，i 也 形成 一 权 值 为 负 的 回路 ， 但 因为 它 
们 从 s 不 可 达 ， 因 此 5s， 二 = 5(s， 站 = ss，i= cc。 

一 些 最 短路 径 的 算法 ， 例 如 Dijkstra 算法 ， 孝 假定 输入 图 中 所 有 边 的 权 取 非 负 值 ， 如 公 
路 地 图 的 实例 。 另 外 一 些 最 短路 径 算 法 ， 如 Belimnan 一 Ford 算法 ， 人 允许 输 人 图 中 存在 权 为 负 
的 边 ， 只 要 不 存在 从 源 结 点 可 达 的 权 值 为 负 的 回路 ,这 些 算 法 都 能 给 出 正确 的 解答 。 特 定 地 
说 ， 如 果 存 在 这 样 一 个 权 为 负 的 回路 ， 这 些 算 法 可 以 检测 出 这 种 回路 的 存在 


最 短路 径 的 表示 方法 
我 们 通常 不 仅 希 望 算出 最 组 路 径 的 权 ， 而 且 也 希望 得 出 最 短路 径 上 的 结 点 。 我 们 所 采用 
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的 最 短路 径 的 表示 方法 类 似 于 第 23.2 节 中 宽度 优先 树 的 表示 法 . 已 知 图 G=(V，H)， 对 每 _ 
个 结 点 uE V， 我 们 设置 其 前 辈 x[v] 为 另 一 结 点 或 NIL. 林 章 中 的 最 短路 径 算法 设置 属性 站 
“以 便 使 源 于 结 点 的 前 非 链表 沿 着 从 s 到 v 的 最 短路 径 的 相反 方向 排列 。 因 此 对 于 某 已 知 
结 点 v 且 x[vj 关 NIL， 我 们 可 以 运用 第 23.2 节 中 的 过 程 PRINT PATHCG， s， 由 来 打印 出 
从 s 到 的 一 条 最 短路 径 。 

不 过 在 最 短路 径 算 法 的 执行 中 ， 无 需 用 的 值 来 指明 最 短路 径 ， 正 如 宽度 优先 搜索 一 
样 ， 我 们 感 兴趣 的 是 由 的 值 归纳 出 的 先辈 子 图 G-= (V.。BE,)。 在 此 我 们 再 次 定义 结 点 集 
合 V, 为 G 5 中 共有 非 先 的 结 点 的 集合 再 加 上 源 针 上 s 

=fveYV: flNIELIJtsI 
pa E, 是 对 V,。 中 的 结 点 由 值 所 导出 的 边 的 集合 : 
= 一 [erfv]， 训 和 了 E: vEV 一 fs 症 

我 位 应 明 本 章 由 拭 法 得 出 的 二 值 有 如 下 性 质 在 算法 结束 时 G,。 就 是 “最 短路 径 树 ， 
-一 非 正 式 地 说 是 一 棵 有 根 树 ， 其 中 包含 了 从 源 结 点 s 到 从 s 可 达 的 每 个 结 点 的 一 条 最 短路 
径 。 最 短路 径 树 和 第 23.2 节 中 讨论 的 宽度 优先 树 相 似 ， 但 是 它 所 包含 的 从 源 结 点 出 发 的 最 
短路 径 是 用 边 的 权 而 不 是 边 的 数目 来 表示 的 。 更 精确 地 说 ， 设 图 G= (V，B) 是 有 向 加 权 
图 ， 其 加 权 函 数 为 w; E->R， 并 假定 G 不 包含 从 源 结 点 SEY 可 达 的 权 值 为 负 的 回路 ， 以 
使 最 短路 径 是 明确 存在 的 。 以 s 为 根 的 最 短路 径 树 是 有 向 子 图 G'= (V'“，E])， 其 中 VEV 
且 也 三 E， 并 满足 下 列 条 件 :， 

1.V' 是 G 中 从 8 可 达 的 绪 点 集合 

”2.G/ 形 成 一 棵 以 $ 为 根 的 有 根 树 
，3. 对 所 有 vEY'，G' 中 从 s 到 v 的 唯一 简单 路 径 是 G 中 从 s 到 v 的 最 短路 径 . 

最 短路 径 并 不 一 定 唯 一 ， 最 短路 径 树 也 不 一 定 是 唯一 的 。 例 如 ， 图 25.2 说 明 一 有 向 加 ” 
权 图 和 有 着 同一 根 结 点 的 两 棵 最 短路 径 树 。 (a) 有 向 加 权 图 ， 并 标 出 了 从 源 点 S 到 各 结 点 
的 最 短路 径 的 权 。 (bj 如 影 覆盖 的 边 形成 一 棵 以 源 点 8 为 根 的 最 短路 径 树 。 (c) 具有 相同 
根 的 另 一 覃 最 短路 父 习 





图 25.2 有 向 加 权 图 和 最短 路 径 树 
本 事 概 述 


本 音 所 讨论 的 单 源 最 短路 径 算法 都 是 基于 一 种 称 为 松弛 技术 的 基础 之 上 的 ， 第 25.1 节 
开始 证 明了 -- 般 性 最 短路 径 的 几 个 重要 性 质 ， 而 后 证 明 有 关 松弛 算法 的 一 些 重要 事实 。 第 
25.2 节 中 讲述 了 Dijkstra 算法 ， 该 算法 解决 了 所 有 边 的 权 非 负 时 的 单 源 最 短路 径 问 题 . 第 ， 
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25.3 节 中 提出 了 Belliman--Ford 算法 ， 该 算法 可 应 用 于 更 一 般 的 情形 一 -- 边 的 权 可 以 为 负 。 

如 果 图 包 售 了 从 源 结 点 可 达 的 权 为 负 的 回路 ， 则 Bellman 一 Ford 算 沪 可 以 榨 测 各 存在 该 

路 。 第 25.4 节 给 出 了 一 种 线性 运行 时 间 的 算法 以 计算 有 向 无 回路 医 中 的 单 源 最 短路 径 。 

后 在 第 25.5 节 中 说 明 如 何 运用 Bellman 一 Ford 算法 来 解决 “线性 规划 ?这 一 特殊 间 题 。 
在 我 们 的 分 析 中 需要 一 些 对 无 穷 盖 进行 计算 的 公式 ， 我 们 假定 对 任意 实数 a 关 -2， 有 

altee=cefa=cc， 同 样 在 存在 权 信 为 负 的 回路 的 情况 下 为 了 使 证 明成 立 ， 我 们 假设 对 性 意 

实数 ace 有 a+( 一 oj= (一 ee)Ha = 一 ce。 


25.1 ”最 短路 从 和 松弛 技术 


要 学 习 单 源 最 短路 径 算 法 ， 首 先 应 了 解 算法 所 采用 的 技巧 以 及 算法 所 利用 的 最 短路 径 的 
性质。 本章 的 算法 所 运用 的 主要 技术 是 软 弛 技术 ， 这 种 技术 反复 减 小 每 个 结 点 的 实际 最 短路 
径 的 权 的 上 限 ， 直到 该 上 限 等 于 最 短路 径 的 权 。 在 本 节 中 ， 我 们 将 看 到 如 何 运用 松弛 技术 并 
正式 证 明 它 的 一 些 特 性 。 

在 开始 阅读 本 节 时 ， 读者 可 能 希望 赂 去 定理 的 证 明 _ 仅 阅读 定理 内 容 然后 立即 学 
习 第 25.2 和 25.3 节 中 的 算法 。 但 请 特别 注意 引 理 25.7，、 它 是 着 民 本章 中 的 最 短路 径 算法 的 
关键 。 开 始 阅 读 时 。 读 者 可 能 也 希望 完全 忽略 有 关 先 奉子 图 和 最 短路 径 树 的 吉 理 ( 引 理 25.8 
和 25.9)， 从 而 集中 精力 学 习 前 面 有 关 最 短路 径 的 权 的 一 些 引 理 ， 


量 短路 径 的 理想 基础 


最 短路 径 算 法 中 利用 了 以 下 性 质 ， 即 两 结 点 间 的 最 短路 径 包 含 了 其 内 部 其 它 的 最 短路 
从 。 这 一 理想 的 基本 性 质 是 可 以 应 用 动态 规划 (第 十 六 章 ) 和 贪心 方法 (第 十 七 章 ) 的 显著 标 ， 
志 。 事 实 上 ，Dijkstra 算法 就 是 一 种 贫 心 算法 ， 而 找 出 每 对 缚 点 间 最 短路 径 的 
Floyd~Warshall 算法 (第 二 十 六 章 ) 则 是 一 种 线性 规划 算法 。 下 面 的 引 理 及 其 推论 更 精确 地 描 
述 了 最 短路 径 的 这 一 理想 的 基础 性 质 ， 

引 理 2S.! 最 短路 径 的 子路 径 也 是 最 短路 从 ) 给 定 某 有 向 加 权 图 G=(V， BE)， 其 加 权 通 
北 为 下 : 了 =~R， 设 p= <vVi， wm，…， 了 四 > 为 从 结 点 Vi 到 结 点 环 的 一 条 最 短路 径 。 对 任意 
ij 有 1 所 ji 和 j 和 k， 设 = <vVi， val …， 有 > 为 从 站 到 Yi 的 P 的 子路 径 ， 则 pi 是 从 w 到 
vi 的 一 条 最 短路 径 。 

证 朋 : 如 果 我 们 把 路 径 p 分 解 为 一 viravi av 则 mw 一 wpi+wpi) 
+ wpr) 现在 假设 从 vi 到 vi 存在 一 路 径 P i， 且 wp) <w(pi) 


则 v， 一 风 加 vi Arv， ay 是 一 条 从 Y， 到 v， 的 路 径 ， 上 且 其 权 wkp， 站 十 WP 十 WwW(pn ) 小 
于 w(p)， 这 与 前 据 了 是 从 到 v， 的 最 短路 径 相 了 矛盾 。 


在 学 习 宽 度 优先 搜索 的 过 程 中 (第 23.2 节 )， 我 们 证 明 过 关于 无 权 图 的 最 短 上 距 离 的 一 个 简 
单 性 质 ( 引 理 23.1》。 下 列 定理 235.1 的 推论 把 该 性 质 推广 到 加 权 图 的 情形 . 

推论 252 设 台 =(VY， 了 本 是 有 向 加 权 图 ， 其 加 权 函 数 为 w: Er->*R。. 候 设 对 某 结 点 u 和 
路 径 p' 从 源 s 到 结 点 v 的 一 条 最 短路 径 P 可 以 分 解 为 ?” u-*v， 则 从 s 到 v 的 最 短路 径 的 
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权 为 s，W= 58，WHwG 有 

证 明 : 根据 引 理 25.1， 子 路 径 p" 为 从 源 结 点 s 到 结 点 u 的 一 条 最 短路 径 ， 所 以 

5s，V) 一 wp) 
一 wW(p?)Hwn，Y) 
三 唤 sS，UHHwfUu，YV) 

(证 毕 ) 罗 

下 一 个 纠 理 将 给 出 最 得 路 径 的 权 的 一 条 简单 而 实用 的 性 质 。 

引 理 25.3 设 G=(VY， 孔 是 一 有 向 加 权 图 ， 其 加 权 函 数 为 w: E->R， 源 结 点 为 s。 则 
对 所 有 按 (u，WEE， 有 5(s， 检 系 5s，UHwu，) 

证 明 : 从 源 结 反 s 到 结 点 v 的 最 短路 和 从 p 的 权 不 大 于 从 s 到 v 的 其 他 路 径 的 权 。 特 别 
地 ， 路 径 p 的 权 也 不 大 于 某 特 定 路 径 的 权 ， 该 特定 路 径 为 从 s 到 m 的 最 短路 径 再 加 上 边 (u， 
(证 毕 ) 


松弛 技术 


本 章 的 算法 中 运用 了 松弛 技术 。 对 每 一 结 点 vEV， 我 们 设置 一 属性 d[v] 来 描述 从 源 s 
到 Y 的 最 短路 径 的 权 的 上 界 ， 称 之 为 最 短路 径 估计 。 我 们 通过 下 面 的 过 程 对 最 短路 径 估计 和 
爷 春 进行 初始 化 。 


INITIALIZE-SINGLE-SOURCE(G， 
1， fer 每 个 顶点 vE YV[G] 


2， dod[v<-oc 
3. gz[vi=-MNIL 
4 d[sj<-0 


经 过 初始 化 以 后 ， 对 所 有 vEV，rivl=NIL， 对 v=s，d[vJ=0， 对 vEV-fsj，d[y]= 

松弛 一 条 边 (uw 的 过 程 包括 测试 我 们 是 否 可 能 通过 结 点 u 对 迄今 找 出 的 到 v 的 最 短路 
径 进行 收 进 ， 如 果 可 能 则 更 新 dIvl 和 r[y]， 一 次 松 范 操 作 可 以 磊 小 最 短路 径 佑 计 的 值 d[y] 并 
香 新 v 的 先辈 域 x[Y]。 下 列 代码 实现 了 对 边 (u， 颁 进行 的 一 步 松 弛 操作 。 


RELAXKa ww1】 
1. 让 dfw> duHwta， 必 
2. then gd[v< duHHwtu， 信 


3. F[v]< ua 
机 虹 由 2 
RELAXKY) 有 ELAKCN 
此 和 睛 ， 
G 一 一 (7) 


(3 《b) 
图 25.3 对 边 (u， 人 进行 松弛 
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图 25.3 说 明了 松弛 一 条 边 的 两 个 实例 ， 在 其 中 一 个 例子 中 最 短路 径 估计 减 小 ， 而 在 另 
一 实例 中 最 短路 径 估计 不 变 。 (a) 因为 在 进行 松弛 以 前 divJ> du+w[au， 避 ， 所 以 div] 的 值 ， 
减 小 。 fb) 在 此 ， 因 为 松 缉 前 dty] 系 d[ujHHwtu，v， 所 以 松弛 不 改变 dv] 的 值 ， 

本 音 中 的 每 个 算法 都 调用 INITIALIZE-SINGLE-SOURCE， 然 后 重复 对 边 进行 松弛 
的 过 程 ， 另 外 还 要 说 明 的 是 松弛 是 改变 最 短路 径 估 计 和 先辈 的 唯一 方式 。 本 章 中 的 算法 之 间 
的 机 互 区 别 在 于 对 每 条 边 进行 松弛 操作 的 次 数 以 及 对 过 执行 缓和 操作 的 次 序 有 所 不 同 。 在 
Dijkstra 算法 以 及 鞠 于 有 向 无 同 路 图 的 最 短路 径 算法 中 ， 对 每 条 边 执行 松弛 操作 -- 次 。 在 
Beliman 一 Ford 算法 中 ， 对 每 条 边 要 执行 多 次 松弛 操作 。 


松弛 的 性 质 


本 章 中 的 算法 的 正确 性 依赖 于 由 于 面 几 条 引 理 总 结 出 的 关于 松弛 的 一 些 重 要 性 质 。 大 老 
数 引 理 描 述 了 对 有 向 加 权 图 的 边 执 行 一 系列 松弛 操作 后 的 结果 ， 该 图 忆 由 
INITIALIZE-SINGLE-SOURCE 进行 初始 化 ， 除 引 理 23.9 以 外 ， 其 余 这 些 引 理 适 用 于 人 尾 
何 松 犯 操作 序列 ， 而 不 是 仅仅 适用 于 产生 最 短路 径 的 松弛 操作 。 

引 理 25.4 设 G=(VY，BE) 为 一 有 疝 加 权 图 ， 其 加 权 范 数 为 w:E->R， 设 (au，EE， 骨 
一 号 执行 RELAX(U，v，w) 对 边 (u， 妇 进行 松弛 之 后 ， 有 d[v] 科 d[ujHwa， 妇 成 立 。 

证 明 : 若 在 对 过 人 na， 人 进行 松弛 之 前 ， 有 d[ 了 >dua+wa，vV， 则 松 凶 之 抽 有 
dm=dm+wtu，7。 如 果 在 松弛 前 有 divj 和 = dujHwu， 玉 ， 则 du 和 dvj 都 没有 变化 。 因 
此 恰 引 之 后 有 dyj 和 datwta， 了 要 。 (证 毕 ) 

引 理 25.$ 设 G=(V，B) 为 一 有 向 吉 权 图 ， 其 加 权 毅 数 为 w:E 一 人 R， 设 sSCYW 为 源 结 点 ， 
”上 且 闹 台 己 被 过 程 INITIALIZE-SINGLE-SOURCE 者 始 化 。 则 对 所 有 vEYV 有 dtvj> 
5s， 并 且 对 三 的 边 进行 任意 序列 的 松弛 操作 ， 该 不 等 式 仍 成 立 。 再 者 ， 一 且 div] 取 得 了 
它 的 下 眼 6s， 人 的 值 再 ， 它 的 值 不 会 再 变化 。 

证 阴 : 不 等 式 帮 相 关 s， 站 在 初始 化 后 显然 成 立 ， 这 是 由 于 d[s]=0>6s，sH 注 意 在 s 
处 王 革 权 为 负 的 回路 中 时 66，s= 一 ee， 在 其 他 情况 下 5s， 忆 =0， 并 且 对 所 有 vE 
V- 革 jj，dyj=ce。 因 此 dj=as，Y)。 我 们 运用 永 盾 性 证 明 来 说 明 对 于 任意 的 松弛 操作 序 
列 林 等 式 顽 能 保持 成 立 。 设 结 点 v 为 对 边 人 ， 凡 进行 松弛 操作 后 引起 d[vj< 5s， 妇 的 第 一 个 
结 点 。 那 么 ， 仅 在 边 人 na， 妇 被 松 犯 后 ， 我 们 有 

dujHwteu， 只 =dIv] 
<fs，W) 
委 史 s，UHwfu， 人 如 《由 中 理 25.3) 
所 以 有 du] < &s， 由 ， 但 由 于 对 这 人 ， 妇 进行 松下 并 不 改变 dmj， 所 以 这 一 不 等 式 此 证 在 对 
该 按 松 弛 之 前 就 已 成 立 ， 这 与 我 们 假设 Y 是 满足 dvj< 5s， 妇 的 第 一 个 结 点 相 半 盾 。 因 此 可 
以 得 出 结论 ， 对 所 有 vE V， 不 变 条 件 dly] 兰 SKs， 们 均 成 立 。 

为 证 册 一 且 diyj=6fs，v， 则 d[ 吕 的 值 就 不 再 改变 ， 我 们 广 辣 到 dly]… 具 达到 其 下界 ， 
就 不 吉 能 继续 减 小 ， 这 是 因为 我 们 刚刚 证 明 div] 关 %s，V)， 又 因为 松弛 操作 并 不 能 使 中 值 增 
各， 所 以 这 时 d[v] 也 不 可 能 增加 。( 证 毕 ) 

推论 25.6 ”假定 在 某 加 权 函 数 为 友 ;E->R 的 有 疝 加 权 图 中 ， 在 源 结 点 3S4V 和 其 指定 结 
点 vEY 之 间 无 路 径 相 通 。 则 在 INITIALIZE-SINGLE-SOURCE(G，s) 对 图 进行 初始 化 
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后 有 dj=5(s，v 在 对 图 的 边 进 行 任意 序列 的 松弛 操作 以 后 ， 该 等 式 始终 保持 成 立 。 

证 明 : 据 旨 | 理 25.35， 总 有 ce= 5G，Wsdvj 成 立 ， 因 此 dy]= ce= 5(s， 由 。 (证 毕 ) 

下 面 的 引 理 对 证 明 本 章 后 面 的 最 短路 径 算法 的 正确 性 来 说 是 至 关 重要 的 。 它 给 出 了 松弛 
使 最 短路 径 估 计 收 敛 到 最 短路 径 的 权 的 充分 条 件 。 

引 理 25.7 设 台 =(V，BE) 为 有 交加 权 冰 ， 其 加 权 苦 数 为 w:E-~R。 设 sEV 为 源 结 点， 
且 对 于 某 些 结 点 uvEV, 设 s uv 是 63 的 一 条 最 短路 径 。 根 定 过 程 
INITIAELIZE-~SINGLE-SOURCE(G，Ss) 已 对 避 进行 了 初始 化 , 且 随 邯 对 G 的 边 执行 了 包 
含 调用 RELAX(u，v， 丰 ) 的 一 个 松弛 操作 序列 。 如 果 在 调用 前 的 任何 时 刻 d[u] = 5(s， 由 ， 
由 调用 凡 后 dv]= 5s， 习 始终 保持 成 立 ， 

证 明 : 由 引 理 25.5 可 知 ， 如 果 在 对 边 (u， 亿 松弛 前 某 时 刻 有 du = &s， 屿 ， 则 此 后 该 等 
式 一 直 成 立 。 作 为 一 种 特定 情形 ， 在 对 边 人 u， 凡 松弛 后 有 


dvlsgdmnHwta， (由 引 理 25.4) 
一 只 S，UHwU，V) 
一 只 8， 人 W 《由 推论 25.2) 


据 引 理 25.$，5s， 人 如 是 dr 四] 的 下 界 ， 由 此 我 们 得 出 d[v] = 5s， 岂 ， 并 且 该 不 等 式 此 后 一 
直 成 立 。( 证 毕 ) 


最 短路 径 树 


到 虽 前 为 止 ， 我 们 已 经 证 明 松弛 使 得 最 短路 径 估 计 单 调 递减 到 实际 最 短路 径 的 权 。 我 们 
同样 希望 证 明 一 旦 某 松 驰 序列 计算 出 实际 最 短路 径 的 权 ， 由 亚 值 归纳 出 的 先辈 子 图 G。 就 是 
G 的 一 棵 最 短路 径 树 。 我 们 从 下 列 引 理 开 始 ， 该 引 理 说 明 先 莫 子 图 是 一 棵 以 源 铺 点 为 根 的 
树 。 

引 理 25.8 设 台 =(V，B) 为 有 间 加 权 图 ， 权 函数 为 w:E 一 尺 。 源 结 点 SSE V， 人 假定 局 
中 不 包含 从 s 可 达 且 要 为 负 的 回路 。 则 过 程 INITIALIZE-SINGLE-SOURCE(G，s) 对 图 
进行 初始 化 后 ， 其 先辈 子 图 台 。 形成 一 标 以 s 为 根 的 树 ， 有 号 不 论 对 怠 的 边 进行 什么 序列 的 撤 
驰 操作 ， 这 一 性 质 始 终 保 持 不 变 。 

证 明 : 开始 时 ，G, 中 的 唯一 结 点 为 源 结 点 ， 所 以 引 理 显然 成 立 。 现 在 我 们 来 考察 经 过 
一 系列 松弛 操作 后 形成 的 先辈 子 图 G,。 我 们 首先 证 明 台 , 中 无 回路 。 为 了 引出 了 矛盾， 假定 
经 过 某 松弛 操作 后 ， 图 台 , 中 产生 了 一 个 回路 。 设 该 回路 为 5c= <w，V，…， 瑟 >， 其 中 
ws=w， 则 可 =w，i=1，2，…，Kk。 不 失 一 般 人 性 ， 可 以 假定 对 边 (w_,， 则 进行 松弛 后 
在 局 , 中 产生 了 回路 。 

我 们 认为 c 回路 中 的 所 有 结 点 均 从 s 可 达 。 为 什么 呢 ? 回 路 中 的 每 个 结 点 均 有 一 个 非 
NE 祖先， 所 以 当 c 上 每 个 结 点 被 赋予 一 个 非 NIL 的 值 时 ， 也 把 一 有 限 的 最 短路 径 估 计 
拭 值 于 它 。 根 据 引 理 25.5， 如 果 回 路 c 上 的 每 个 结 点 都 有 一 有 限 的 最 短路 径 的 权 ， 则 说 明 它 
是 从 s 可 达 的 。 

我 们 将 对 调用 RELAX(w，，，) 之 前 的 到 路 c 上 的 最 短路 径 估 计 进 行 检 查 ， 并 证 明 
是 一 权 为 观 的 回路 ， 这 样 就 与 如 中 不 包含 从 源 结 点 可 达 的 权 为 负 的 回路 的 假设 相 和 矛盾 。 
在 调用 前 ， 有 rz[w]=Y_ ，i= 1，2，…，k-~1， 因 此 对 i= 1，2，…，k-1， 对 d[vi] 的 最 后 一 
次 更 新 是 由 赋值 语句 d[vil< -d[v_ +w(vwi，v-) 执 行 的 。 若 从 此 d[v_,] 的 值 发 生变 化 ， 其 值 必 
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定 减 小 。 因 此 在 调用 RELAX(vk_ ，w， mW 之 前 ， 有 
wd]HwCw wii=12… 水 一 ! (25.1) 
因为 调用 改变 了 zx[v] 的 值 , .有 下 列 严 格 的 不 等 式 成 立 : 
diwj> dv +Hwv ii，vD 
把 这 一 严格 不 等 式 和 式 (25. 1) 的 k 一 1 个 不 等 式 相 加 ， 我 们 就 得 到 回路 c 的 最 短路 醋 估计 的 和 . 


yalv]> >dakv_ 中 ww 六 


i 王 下 ie=1 


= Fak，1+ zw ， v ) 


了 


但 是 因为 回路 c 中 等 个 结 点 在 每 个 和 式 中 仅 出 现 一 次 ， 凤 此 
之 dy 一 记 d[v- | 
”这 说 明 


让 
0> >wv  ，Yi) 
i=1 


所 以 沿 回 路 ec 的 权 之 和 为 全 ， 因 而 产生 了 矛盾. 

现在 我 们 已 证 明 G, 是 有 向 无 回路 图 。 槛 证 明 它 基 一 模 以 s 为 根 的 树 ， 只 要 证 明 下 列 结 
论 就 可 以 了 ， 即 对 每 个 结 点 vEYV ， 台 .中 存在 从 5 到:v 的 唯一 通路 (元 练习 5.5 一 3)。 

我 们 首先 说 明 对 V。 中 的 每 个 结 点 存在 一 条 从 .s 出 发 的 通路 。，V。 中 的 结 点 是 其 天 值 为 非 
NIL 的 结 点 再 加 上 结 点 s。 这 里 须 设 法 通过 归纳 证 明 从 ss 到 V.。 中 的 所 有 结 点 均 有 通路 。 证 
明 的 详细 过 程 留 作 练习 ( 见 练 习 2S.1 一 全 。 、 

为 完成 引 理 的 证 明 ， 必须 证 明 对 任意 结 点 vEV ， 图 G, 中 从 s 到 v 至 多 存在 一 一 条 路 

。 盆 定 从 s 到 某 结 点 存在 两 条 简单 通路 ，p 和 p。， 其 中 pi 可 分 解 为 srnx-Zz~eV， 
本 可 分 解 成 sS~ur“y-ZreV，X- 天 放 ( 见 图 25.4)， 则 有 zl 可 =x， 如 了 一 y。 这 说 明 x=y ， 与 假设 
相 了 矛盾 。 由 此 可 得 出 结论 ，G。 中 从 ss 到 v 仅 存在 唯一 的 简单 路 径 ， 因 此 G, 是 一 棵 以 s 为 根 
的 有 根 树 。({ 证 人 毕 ) 





图 25.4 说 明 Oo 中 从 所 点 s 到 纤 点 的 路 径 是 唯一 的 


现在 我 们 可 以 说 明 :; 如 果 在 我 们 进行 了 一 系列 松弛 操作 后 ， 真 正 的 最 短 通 路 的 权 被 赋 给 
每 个 结 点 ， 那 么 先辈 子 图 G, 是 一 棵 最 短路 径 树 。 
引 理 25.9 设 G=(V，B) 是 一 有 向 加 权 图 ， 加 权 函 数 为 w,E-*R， 源 结 点 sSEV， 并 假 
定 巴 中 不 包 合 从 ss 可 达 的 权 为 负 的 回路 ， 我 们 调用 INITIALIZE-~ SINGLE 一 
SOURCE(G，s9， 然 后 对 避 的 边 执行 任意 序列 的 松弛 操 作 ， 对 所 有 v&V， 计 算出 
dvj= 5fs，Wj。 刚 先辈 子 图 G, 是 以 s 为 根 的 一 棵 最 短路 径 树 ， 
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证 明 : 我 们 必须 证 明 贺 G, 满足 最 短路 径 树 的 三 条 性 质 。 为 了 说 妆 其 中 第 一 条 性 质 ， 必 
须 证 明 V, 是 从 s 可 达 的 针 点 集合 。 根 据 定 义 ， 最 姐 跨 径 的 权 5s， 为 有 洱 值 , 当日 人 当 v 
从 s 可 达 。 所 以 ， 从 s 可 达 的 结 点 实际 上 就 是 那些 县 有 有 限 d 值 的 结 点 。 但 对 于 缚 点 
Y-f}， 其 div] 被 赋予- 一 有 限 值 当 且 仪 当 六 NIL， 因 此 ，V,，。 中 的 缚 点 正 是 那些 从 s 可 达 
的 结 点 。 

南 引 理 25.8 可 知 第 一 条 性 质 成 立 . 

附 此 现在 剩 下 的 就 是 证 骨 最 短路 径 树 的 最 后 一 条 性 质 : 对 所 有 v Vs，Gu 中 的 唯一 简单 
路 径 swmv 就 是 已 中 从 s 到 vv 的 最 短路 径 。、 我 们 放 p= <vo、VW，…，W)， 其 中 ww=s 县 
ww=Vv， 对 ji=1，2，…，K， 有 二 中 =5s， 由 和 dvd[v_ HHww mn) 均 成 立 ， 由 此 可 得 
Www 1，W 委 5s， VJ6fs， Vi。 路 入 把 权 框 邵 ， 得 

wp) 一 >wv vv) 


雯 》(5(S， VD 一 5s，v 诱 


一 Ets， v 一 5s，vi) 
一 前 S，Y 了 


第 3 行 由 第 2 行 的 过 代 和 生成 ， 第 4 行 源 于 第 3 行 的 5fs，v=50s，B)=0。 所 以 有 
wp) 乏 Bs， 刀 是 从 ss 到 的 任何 路 径 的 权 的 下 界 ， 由 此 得 出 ww)= 克 s，w)， 因 此 路 径 P 
是 从 s 到 v=v 的 一 条 最 短路 径 。 


25.2 Dijkstra 算法 


Dijkstra 等 法 解决 了 有 阿 加 权 图 的 最 短路 径 癌 题 。 该 党 法 的 条 作证 总 图 局 有 按 的 权 大 
负 ， 困 此 在 本 节 中 我 们 假定 对 每 条 过 (人 u， 妇 塘 王 ，wf， 帮 产 站 。 

Dijikstra 算法 中 设置 了 一 结 点 集合 3S， 从 狐 结 点 s 到 集合 中 蜂 点 的 最 终 最 短路 径 的 权 改 
已 确定 ， 即 对 所 有 结 点 vf 8$， 人 Gs，VYj。 算 读 反 复 挑 庭 出 其 最 短路 径 佑 计 为 最 小 的 
结 点 af V-S， 把 袜 搬 和 集合 SS 中， 并 对 离开 性 的 所 有 边 进 行 松弛 。 在 下 列 算 法 案 现 中 设置 
了 优先 陵 殉 Q， 该 队列 包含 所 有 属于 V-S 的 铺 点 ， 且 队 歼 中 各 结 点 都 存根 应 的 4 值 。 算 法 
假定 殴 G 由 分 接 玫 表示 。 

[ijkstra( 司 ，w，S} 

本 INITIALIZE-SINGLE-SOURCELG， SB) 
S< -下 
_Q<Yv[G] 
册 坦 司 全 天 中 

im Ue- 王 下 RAT--WTINTGO) 

S<. SUTTU1 

for 符合 顶点 YE Adilu] 

do 及 EL 和 其 (Da，V， 友 ) 

Dijkstra 算法 如 图 25.5 所 未 对 边 进行 松 凶 ， 最 左 缚 点 为 源 缚 点， 贷 个 绪 点 内 为 其 最 短 

路 径 佑 计 。 
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”图 25.5 Diikstra 算法 的 执行 流程 


”阴影 林 盖 的 边 说 明了 前 驱 的 值 : 如 果 边 (u，v) 为 阴影 所 覆盖 ， 则 z[v]=u。 黑 色 缚 点 
属于 集合 S$，、 白 色 结 点 属于 优先 著 列 只 =V-S。 第 1 行 对 4 和 三 值 进 行 通常 的 初始 化 工作 ， 
第 2 行 置 集合 8 为 空 集 。 第 3 行 对 优先 队列 @Q 进行 初始 化 使 其 包含 V-S=V- 中 =V 中 的 所 
有 结 点 。 每 次 执行 第 4-8 行 的 while 循环 时 ， 均 从 队列 QQ=YV-S 中 压 出 一 结 点 并 搬 人 到 
集合 s 中 (第 一 次 循环 时 ua=sj。 因 此 在 V-S 中 的 所 有 结 点 中 ， 结 点 吕 且 有 最 小 的 最 短路 径 
估计 。 然 后 ， 第 ?-8 行 对 以 u 为 起 氮 的 每 条 边 人 ,内 进行 松弛 。 如 果 可 以 经 过 痢 来 改进 到 结 
点 y 的 最 短路 径 ， 就 对 估计 值 d[V] 以 及 先辈 区 v] 进 行 更 新 。 注 意 在 第 3 行 以 后 就 不 会 再 播 人 
结 点 到 Q 中 ， 并 且 每 个 结 点 只 能 从 Q 弹出 并 插 人 8S 一 次 ， 因此 第 4--8 行 的 whitie 人 
代 次 数 为 |[Y| 次 。 

因为 Dijkstra 算法 总 是 在 集合 V-S 中 选择 "最 轻 ?” 或 “最 近 ” 的 结 点 插 人 集合 s 中 ， 因 此 
我 们 说 它 使 用 了 信心 策略 。 俩 心 策略 已 在 第 十 七 章 中 作 了 详细 前 述 ， 不 过 无 需 阅读 第 十 七 章 
也 可 以 读 懂 Dijkstra 算法 。 贪心 策略 并 非 总 能 获得 全 局 意义 上 的 最 理想 结果 ， 但 正 旭 下 列 
定理 和 推论 所 述 ，Dijkstra 算法 确实 计算 出 了 最 短路 径 。 关 键 是 证 明 每 当 结 点 u 被 插 人 和 集合“ 
S 时 , .有 du]= 5s， 轨 成 立 。 加 

定理 25.10(Dijkstra 算法 的 正确 性 证 明 ) 已 知 -一 有 向 加 权 图 G={V，E)， 其 加 权 函 数 
w 的 值 为 非 俩 ， 源 结 点 为 s。 如 果 对 该 图 返 行 Diikstra 算法， 则 在 算 法 终止 时 ， 对 所 有 TuE 
忆 有 dlaj= 上 ss， 让) 

证 明 : 我 们 将 证 明 对 每 一 结 点 utE V， 当 u 被 插入 集合 S 时 有 d[u]= 5s， 癌 成 立 ， 且 此 
后 该 等 式 -- 直 保持 成 立 。 

为 了 引出 了 矛盾 以 证 明定 理 ， 设 唱 是 被 插 人 集合 $ 中 的 第 -一 个 满足 dfu]j 关 5(s，u) 的 结 
点 。 我 们 将 集中 注意 while 循环 的 选 代 开始 时 的 情形 。 然 后 通过 检查 从 s 至 u 的 最 短路 径 推 . 
导出 在 此 时 d[u] = 5(s，m， 从 而 与 假设 相 矛 盾 ， 必 须 有 只 s， 这 是 因为 s 是 插 人 集合 S 的 
第 一 个 针 战 且 此 时 dlsj = 一 is，s)= 王 0， 又 因为 U 关 s， 所 以 我 个 可 以 得 出 在 二 被 搬 人 集合 $ 
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前 S 关 @. 从 s 到 _ 必 存在 某 条 通路 ， 因 为 否则 根据 推论 25.6，d[u] = 5s，m) = o, 这 将 与 
我 们 假设 dm] 关 5(s，u) 相 违背 。 因 为 至 少 存在 一 条 路 径 ， 所 以 从 s 到 存在 一 条 最 短路 ， 
径 p。 路 径 p 联接 集合 $ 中 的 结 点 s 到 -- $ 中 的 结 点 u。 我 们 来 考察 沿路 径 p 的 第 一 个 属 
于 V 一 S 的 结 点 y， 设 xseV 是 y 的 先 厂 。 因 此 如 图 25.6 所 示 ， 路 径 p 可 以 分 解 为 swx 
一 了 八 2 

当心 被 播 人 S 时 ， 我 们 断言 d[y] = 5Gs， 妨 。 为 证 明 这 一 断言 正确 ， 注 意 xES， 则 因为 
u 是 播 人 集合 S 且 满 足 du] 寺 6(s， 妆 的 第 一 个 结 点 ， 所 以 当 X 被 播 人 集合 S 时 有 dx]= 5s， 
xj)。 边 区 ， 尺 在 此 刻 被 松弛， 因此 由 引 理 25.7 可 知 上 述 断 言 成 立 。 

现在 我 们 可 以 得 出 矛盾 来 证 明定 理 。 因 为 在 从 s 到 的 最 短路 径 上 y 出 现在 之 前 吾 所 
有 边 的 权 均 为 非 负 (特别 是 路 径 b2 中 的 边 )， 所 以 我 们 有 5(s， 妨 乏 5(s，m， 因 而 


dly] 一 和 As， 妨 
委 和 LS，1) [25.2) . 
关 dEu] (由 引 理 25.3) 


但 因为 在 第 5 行 中 选择 屏 时 结 点 u 和 了 都 属于 V-S， 所 以 有 du 乏 diyj， 因 此 (25.2) 中 
的 两 个 不 等 式 实际 上 均 为 等 式 ， 这 样 得 出 
dy]= 5(s， 妇 =5s，D) 一 du] 
最 后 得 出 结论 duj = 5fs， 了 本， 这 与 我 们 对 u 的 假设 相 刻 于 。 这 样 我们 证 明了 每 个 结 点 了 
&YV 被 搬 人 集合 S$ 中 时 ， 有 相 a] = 5s， 加 成 立 ， 而 根据 引 理 2$.$5， 这 一 等 式 此 后 一 直 保持 
成 立 。( 证 毕 ) 





图 25.6 定理 25.1]0 的 证 明 过 程 


”推论 25.11 已 知 一 加 权 函 数 非 负 且 源 结 点 为 s 的 有 向 加 权 图 =(VY，E)， 若 在 该 图 上 
运行 Dijkstra 算法 ， 则 在 算法 终止 时 ， 先 华 子 图 台 , 是 一 标 根 为 s 的 最 短路 径 树 ， 
证 阴 : 由 定理 2$.10 和 引 理 2$.9 立即 可 证 。 (证 毕 ) 


分 析 


Dijkstra 算 污 的 执行 速度 如 何 ?首先 我 们 考虑 用 线性 数 给 来 实现 优先 队列 QQ= V-S 的 情 
形 。 在 该 算法 实现 下 ， 每 次 EXTRACT-MIN 操作 运行 时 间 为 O(V， 存 在 | 有 次 这 样 的 操 
作 ， 所 以 EXTRACT-MIN 的 全 部 运行 时 间 为 DO(V3j。 因 为 每 个 结 点 vEYV 仅 被 插 人 集合 S 
一 次 ， 所 以 在 算法 的 执行 过 程 中 邻接 表 Adjfvl 中 的 每 条 边 在 第 4-8 行 的 for 循环 中 仅 被 考察 
一 次 。 因 为 在 所 有 邻接 表 中 边 的 总 数 为 |E|， 所 以 在 该 for 循环 中 总 共存 在 IE| 次 迭代 ， 每 次 选 
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代 运 行 时 间 为 D0D)， 因 此 整个 算法 的 运行 时 间 为 O(V2+E)=OCV5。 

但 在 稀 朴 图 的 情形 下 ， 册 二 叉 堆 来 实现 优先 队列 Q 是 比较 实用 的 。 由 此 而 形成 的 算法 
有 时 被 称 为 改进 的 Dijkstra 算法 。 这 样 每 个 EXTRACE-MIN 操作 需要 时 间 OUlg V)， 如 前 
所 述 ， 存 在 |Y| 次 这 样 的 操作 。 建 立 二 叉 崔 需要 时 间 为 DO(V)。 在 RELAX 中 的 赋值 语句 dy] 
<dfiul+wtm， 妇 是 通过 调用 DECREASE-KEY(Q，v，dtujHwtu， 几 ) 来 完成 的 ， 运 行 时 间 
为 DQg V)( 参 见 练习 7.5- 和 ， 并 且 至 骆 存 在 |EI 次 这 样 的 操作 。 现 此 算法 的 全 部 运行 时 间 为 
O((V+E) lg V)， 如 果 所 有 结 点 均 从 狼 结 点 可 达 ， 则 适 行 时 间 为 DAE 1g V)。 

事实 上 ,用 Fibonacci 堆 { 见 第 二 十 一 章 ) 来 实现 优先 队列 Q 的 话 , 可 以 将 运行 时 间 改 为 
O(V lg V+E)。|V| 次 EXTRACT-MIN 操作 中 每 次 的 平 摊 代 价 为 DUg V)， 且 El 次 PE- 
CREASE--KEY 调用 中 每 次 的 平反 时 间 仅 为 OLD)。 从 历 史上 看 来 ， 由 于 在 改进 的 Diikstra 
算法 中 对 DECREASE-KEY 的 调用 远 比 对 EXTRACT-MIN 的 调用 多 ， 所 以 能 够 减少 每 
次 DECREASE-KEY 操作 的 平 拓 时间 到 OUlg V), 并 且 不 会 增加 EXTRACT- MIN 的 平 捧 
时 间 的 任何 方法 的 应 用 , 都 能 够 获得 渐 近 意义 上 较 快 的 算法 。 正 是 因为 这 一 点 , 才 推 动 了 
Fibonacci 堆 的 发 展 . | 
Diikstra 算法 和 宽度 优先 搜索 ( 兄 第 23.2 节 ) 以 及 计算 最 小 生成 树 的 Prim 算法 ( 见 24.2 条 ) 
都 有 有 类似 之 处 。 它 和 宽度 优先 搜索 的 相似 性 在 于 项 者 的 集合 $ 相当 于 后 者 的 黑色 结 点 集合 ; 
正如 集合 & 中 的 结 点 有 着 最 终 的 最 短路 径 的 权 值 ， 宽 度 优 先 搜索 中 的 黑色 结 点 也 有 其 正确 
的 宽度 优先 距离 。Dijkstra 算法 与 Prim 算法 的 相似 之 处 在 于 两 种 算法 均 采 用 优先 队列 来 如 
找 给 定 集 合 以 外 的 “最 轻 * 结 点 (Diikstra 算法 中 的 集合 $ 以 及 Prim 算法 中 的 生长 树 )， 然 后 
把 该 结 点 播 人 集合 并 相应 调整 该 集合 以 外 剩余 结 点 的 权 . 


25.3 “Belliman-Ford 算法 


Beltman 一 Ford 算法 能 在 更 一 般 的 情况 下 解决 单 源 最 短路 径 问 题 ， 在 该 算法 下 边 的 权 可 
以 为 负 。 已 知 有 向 加权 图 G=(V，B 巧 ， 其 源 缚 点 为 s， 加 权 冰 数 为 w:E- 有 R， 对 该 图 运行 
Bellman-Ford 算法 可 返回 一 布尔 值 ,表明 图 中 是 否 存在 一 个 从 源 结 点 可 达 的 权 为 负 的 回 
路 。 若 存在 这 样 的 回路 ， 算 法 说 明 该 问题 无 解 。 若 不 存在 这 样 的 回路 ， 算 法 将 产生 最 短路 径 

及 其 权 ， 、 

正如 Di 水 stra 算法 一 样 ,Beliman 一 Ford 算法 运用 了 松弛 技术 ， 对 每 一 结 点 YECV， 恶 
步 减 小 从 源 s 到 v 的 最 短路 径 的 权 的 估计 值 d[yj 直 至 其 达到 实际 最 短路 径 的 权 5(s，w)。 算 
法 返回 布尔 值 TRUE 当 且 仅 当 图 中 不 包含 从 源 结 点 可 达 的 负 权 回路 。 


Beitrmnan 一 Ford( 台 ， 双 ， 时 
IJMNITIALIZE-SINGLE-SOURCEL(S， 强 
2， forilto YIG-L 
3 do for 每 条 边 人 ， 六 EEIG] 
二 do 了 REEL 和 区位，Y， 人 三 ) 
S， for 等 条 边 人 fa， 太 EE[Gj 

丰 do 这 dv]> du]Hwteua， 必 

了 then retuFn 下 点 LSE 

8 retutin TRUE 
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图 25.7 说 明了 Bellman-~Ford 等 法 在 5 个 结 点 的 图 上 的 执行 流程 


下 和 和 






图 25.7 Bellman 一 Ford 算法 的 热 行 流 程 


源 结 点 为 z。 每 个 结 点 内 为 该 结 点 的 4 值 ， 阴 影 槛 盖 的 边 说 明了 r 值 。 在 该 实例 中 ， 
Belhiman 一 Ford 算法 妈 癌 TRUE。 在 进行 了 通常 的 韧 始 化 后 ， 算 法 对 图 的 地 执行 jVi-1 趟 操 
作 。 每 趟 均 为 第 2-4 行 for 循环 的 一 次 迁 代 ， 在 迭代 过 程 中 对 图 的 每 条 边 松 弛 一 次 . 
25.7(b)(e) 说 明了 全 部 四 趟 操作 的 每 一 趟 后 算法 的 状态 ， 在 进行 完 |YI-1 趟 操作 后 ， 算 法 
58 行 检查 是 否 存 在 负 权 的 回路 并 返 团 正确 的 布尔 值 (我 们 将 在 稍 后 一 些 时 候 看 到 这 一 检查 
为 什么 有 用)。 

Beltmasn 一 Ford 算法 的 运行 时 间 为 DIVE)， 这 是 由 于 第 1 行 的 初始 化 占用 时 间 为 
人 @(V)， 第 2 一 4 行 对 过 进 行 的 |Vl-1 趟 操作 的 每 一 趟 运行 时 间 为 DIE)， 第 5 一 7 行 的 for 循环 
的 运行 时 间 为 O(E). 

为 了 证 明 Belfmnan-Ford 算法 的 正确 狂 ， 我 们 先 来 证 明 如 果 不 存在 权 为 负 的 回路 ， 则 对 
所 有 从 源 绪 点 可 达 的 结 点 ， 算 法 均 正 确 地 计算 出 其 最 短路 径 的 权 。 对 该 引 理 的 证 明 运 用 了 隐 
含 在 算 放 背后 的 一 些 直觉 知识 。 

引 理 25.12 设 各 =(V， 了 为 有 向 加 权 图 ， 源 结 点 为 加 权 函 数 为 w:E- > 及 ， 并 且 假 定 
G 不 包 售 从 s 可 达 的 权 为 员 的 回路 。 则 在 算法 Bellhman-Ford 终 赴 时， 对 所 有 有 从 s 可 达 的 结 
点 v 有 dv]= fs，vY)。 

证 明 : 设 v 为 从 ss 可 达 的 结 点 ， 且 P= <vw，V，…。，w> 为 从 s 到 *v 的 一 条 最 短路 径 ， 
其 中 mw=s 帮 一 vv 因为 路 径 P 荐 简单 路 径 ， 所 以 k 志 |wl-1。、 我 们 希望 通过 归 商 证 明 对 
i=0，I，…k， 在 对 G 的 边 进行 完 第 i 趟 操作 后 有 d[v]= 5(s，vi)， 且 该 等 式 此 后 一 直 保 持 成 
立 。 因 为 总 共有 |VH1 趟 操作 ， 证 明 上 述 结论 就 足以 证 明 引 理 成 立 。 

作为 基础 ， 在 初始 化 后 有 dvql = 5G，vo)=0， 并 且 由 引 理 25.5， 该 等 起 此 后 一 直 成 
芭 。 
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下 面 进行 归纳 。 假 定 在 第 计 1 趟 后 有 d[v -=5G6，Vv 成立 。 边 (v_ ， 四 在 第 i 趟 中 被 
松弛 ， 因 此 根据 引 理 257 可 知 在 第 直 以 及 其 后 有 dy 一 5s， 则 成立， 从 而 完成 了 定理 证 
明 。 (证 毕 ) ， 

推论 25.13 设 台 =(V， B) 为 有 向 加 权 图 ， 源 结 点 为 sS， 加 权 了 数 为 w:E-~ 有 R。 对 每 一 结 
点 vEV， 从 5 到 存在 一 条 通路 当 旧 仅 当 对 G 运行 Belhman-Ford 算法 ， 和 外 法 终止 时 ， 有 
dfv] < ce。 

证 明 : 推论 的 证 明 与 引 理 25.12 类 似 ， 贸 作 练 习 {( 练 习 25.3 一 2?)， 

定理 站 .14(Bellman-Ford 竺 法 的 正 玉 性 证 明 ) 设 G=(Y，B) 为 有 向 加 权 图 ， 源 结 点 为 
s， 加 权 函 数 为 w:E-> 有 R， 对 该 图 运行 Belltman 一 Ford 算法 .车 扣 不 包含 从 gs 可 达 且 权 为 负 
的 回路 ， 则 算法 返回 TRUE， 对 所 有 结 点 vEV 有 diwj= 5(s，W， 并 且 其 先辈 子 图 后 是 以 
s 为 根 的 一 棵 最 短路 径 树 。 如 果 台 包 售 从 s 可 达旦 权 为 负 的 回路 ， 则 算法 返回 下 ALSE。 

证 明 : 假设 图 G 不 包含 从 s 可 达 目 其 权 为 负 的 回路 ， 我 们 首先 证 明 这 样 一 个 结论 ;在 算 
法 终止 时 ， 对 所 有 结 点 vEV， 有 dv]= 5(s，y) 成 立 。 如 果 结 点 v 从 s 可 达 ， 则 由 引 理 25.12 
可 知 上 述 绪论 成 立 。 如 果 v 从 s 不 可 达 ， 则 由 推论 25.6 同样 可 得 上 述 结论 。 这 样 就 证 明了 
该 结论 。 由 此 结论 和 引 理 25.9 可 知 口 , 是 一 标 最 短路 径 树 。 现 在 我 们 运用 这 一 结论 来 证 明 
Beitman 一 Ford 算法 返回 TRUE。 在 算法 结束 时 ， 对 所 有 边 (0， 人 内 EE 有 : 

dvj=as, 太 人 
和 多 8，uUjHwiu， 人 ) (由 引 理 25、 3 
=d[aHHwu， 史 
这 样 算法 第 6 行 的 测试 不 会 使 得 Bellman--Ford 算法 返回 FALSE， 则 算法 必然 返 回 
TRUE。 

相 天 地 ， 我 们 假设 图 G 包含 一 权 为 负 的 回路 ec 一 <Vo， Vi，…， 几 >， 其 中 mm=w， 该 

回路 从 s 下 可 达 。 则 


>Ywe ， vJ<0 (25.3) 
为 了 引出 矛盾 ， 恨 设 Bellman-Ford 算法 此 时 返回 TRUE。 因 此 ,对 i=1，2，…，K， 
有 dtwsdfw-j+HwtwLi， 加 ， 把 回路 中 所 有 这 样 的 不 等 式 相 加 ， 册 有 
2Zdkv]< Ziv -+ZwG v ) 


正如 在 引 理 25.8 的 证 明 中 所 述 ， 在 上 式 前 面 商 个 求 和 式 中 ， 每 个 结 点 * 均 只 出 更 一 
次 ， 因 此 


atv 1 = ak， 呈 


此 外 ， 由 推论 25.13 可 知 ， 对 i= 1，2，…，Kk，d[v;,] 为 有 限 值 ， 所 以 


0 瓜 >we YY) 


1 一] 


这 就 与 (25.3) 的 不 等 式 相 首 盾 。 至 此 我 们 得 出 结论 :如 果 图 G 中 不 包 售 从 源 结 点 可 达 且 权 为 
负 的 回路 ，Beliman 一 Ford 算法 返回 TRUE， 否 则 算法 返回 FALSE。( 证 毕 ) 
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25.4 有 向 无 回路 图 中 的 单 源 最 短路 径 


按 结 点 的 拓扑 序 列 对 某 加 权 图 dag( 有 向 无 回路 图 XG= (V，EB) 的 边 进行 松弛 后 ， 就 可 以 
在 BOV+E) 时 间 内 计算 出 单 滁 最 短路 径 。 在 有 向 无 回路 图 中 最 短路 径 总 是 存在 的 ， 这 是 因为 
即使 图 中 有 权 为 负 的 近 ， 也 不 可 能 存在 权 为 负 的 回路 。 
算法 开始 时 先 对 有 向 无 回路 图 进行 拓扑 排序 ( 详 见 第 23.4 节 )， 以 人 恒 获 得 结 点 的 线性 序 . 
列 。 如 果 从 缚 点 u 到 结 点 v 存 在 一 通路 ， 则 在 拓扑 序列 中 忆 先 于 v。 在 拓扑 排序 过 程 中 我 们 
仅 对 结 点 执行 一 趟 操作 。 当 对 每 个 结 点 进行 处 理 时 ， 从 该 结 点 出 发 的 所 有 边 也 被 松弛 . 
DAG--SHORTEST-PATHS(G，w， 引 ， 本 
1， 对 台 的 铺 点 拓扑 排序 
2，INITIALIZE-SINGLE-SOURCE(G，86) 
3， “for 折 扑 序列 中 的 每 个 结 点 
才 io for 每 个 结 点 v 拓 上 生 而 [u] 
5 do RREIL 训 其，v， 友 ) 





图 25.8 在 有 向 无 环 图 中 寻找 最 短路 径 算法 的 执行 过 程 


图 25.8 所 示 的 例子 说 明了 算法 的 执行 流程 。 源 点 为 。 对 结 点 从 左 到 右 进 行 了 扬 扑 排 
序 ， 每 个 结 点 内 是 该 结 点 的 ,d 值 ， 阴 影 覆盖 的 边 提示 出 值 ， : 
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本 算法 的 运行 时 间 由 第 1 行 和 第 3-5 行 的 for 循环 决定 。 如 第 23.4 节 所 述 ， 拓 扑 排序 
的 运行 时 间 为 B(V+E)。 在 第 3-$ 行 的 for 循环 中 ， 和 Dijkstra 算法 一 样 ， 对 每 个 结 点 均 进 
行 一 次 迁 代 。 对 于 每 个 结 点 ， 从 该 结 点 出 发 的 每 条 边 均 被 考察 一 次 。 但 与 Dijkstra 算法 不 ， 
一 样 的 是 ， 等 条 边 仅 占用 OLD) 的 运行 时 间 。 因 此 全 部 运行 时 间 为 目 (V+E)， 该 运行 时 间 与 钢 
的 邻接 表 的 规模 成 线性 关系 。 

下 列 定 理 表明 过 程 DAG-SHORTEST-PATHS 能 够 正确 地 计算 出 最 短路 径 。 

定理 25.1$ 如 果 有 向 加 权力 G=(V，B) 的 源 结 点 为 s 县 不 包含 回路 ， 则 在 过 程 
DAG-SHORTEST-PATHS 运行 结束 时 ， 对 所 有 结 点 vEV， 有 divj=5s，w， 并 及 上 先 旨 
子 图 扣 , 是 一 栋 最 短路 径 树 . 

-证明 : 我 们 首先 来 证 明 算 法 结束 时 对 所 有 铺 点 vEV， 有 dy=a5s，v)。 如 果 v 从 S 不 
可 达 ， 则 由 推论 25.6， 有 dv]= 5s， 太 =c， 现 在 假设 Y 从 s 可 达 ， 则 存在 一 条 最 短路 径 
p= <Vvo，VI，…， 放 >， 其 中 轴 =s， 下 =w 因为 我 们 是 按 拓 扑 序列 对 结 点 进行 处 理 ， 所 以 
路 径 p 上 的 边 应 接 顺 序 (wo，v)，Gv，v)]，…，( 人 (iv 进行 松弛 ， 用 引 理 2$.7 进行 简单 
归纳 ( 像 引 理 25.12 的 证 明 那 样 ) 可 知 在 算法 结束 时 ，d[vi]= 5(s， 阅 ，i=0，1，…，k。 最 后 
根据 引 理 25.9 可 知 所 , 是 一 棵 最 短路 径 树 。 (证 毕 ) 

对 该 算法 的 一 个 有 趣 的 应 用 是 在 PERT 图 (PERT 是 “program evaluation and review 
technigque"， 即 计划 秆 评 法 的 缩写 }。 的 分 析 中 确定 关键 路 径 。 图 的 边 表示 要 完成 的 工作 ， 边 
的 权 表 示 完 成 特定 工作 所 需 时 间 。 如 果 过 人 on， 人 进入 结 点 v 且 按 (v， 妇 离开 结 点 v， 则 工作 
中 ，v) 必 须 在 工作 (v， 之 前 完成 。 该 有 向 无 回路 图 的 路 径 表 示 应 按 某 特 定 顺 序 完 成 的 工作 
序列 。 关 键 路 径 是 指 有 向 无 回路 图 中 的 最 长 路 径 ， 相 庶 于 完成 有 序 的 一 系列 工作 所 需 的 最 长 
时 间 。 关键 路 径 的 权 是 完成 全 部 工作 所 需 时 间 的 下 限 。 我 们 可 以 用 下 曾 丙 种 方法 求 找 出 关键 
路 季 : 

- 对 边 的 校 取 负 值 并 运行 DAG-SHORTEST-PATHS， 或 
- 在 第 2 行 的 INITIALIZE-SINGLE-SOURCE 中 把 ce 改 为 -ee， 并 且 把 RELAX 过 程 中 
的 “> * 改 为 "< "后 再 运行 DAG-SHORTEST-PATHS。 


25.S ”差分 约束 与 章 短 路 径 


在 一 般 的 线性 程序 设计 问题 中 ， 我 们 希望 对 由 一 组 线性 不 等 式 定 义 的 线性 函数 进行 优 
化 。 在 本 节 中 ， 我 们 将 考察 可 以 简化 为 寻找 单 源 最 短路 径 的 线性 程序 设计 的 一 种 特殊 情形 。 
由 此 引出 的 单 源 最 短路 径 问 题 可 以 运用 Bellman--Ford 算法 来 解决 ， 这 样 线性 程序 设计 问题 
也 因此 而 获得 解决 

线性 程序 设计 

在 一 般 线性 程序 设计 问题 中 ， 给 定 一 xan 矩阵 A，m 维 向 量 b 和 了 | 维 向 是. 我 们 硕 
望 找 出 由 个 元 素 组 成 的 向 量 x， 在 由 Axs<b 所 给 出 的 四 个 约束 条件 下 ， 使 且 标 阴 数 
> ,cix 达到 最 大 值 。 

很 多 问题 都 可 以 用 线性 程序 设计 来 描述 ， 为 此 , 在 线性 程序 设计 问题 的 算法 方面 已 作 了 
大 量 的 工作 。 在 实际 应 用 中 , 单 工 算法 能 够 很 快 地 解决 一 般 的 线性 问题 。 但 是 , 即使 对 精心 
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设计 的 输入 ， 单 工 方法 也 可 能 需要 指数 级 的 运行 时 间 。 一 般 线性 问题 可 以 用 椭 面 算法 或 
Karmerkar 算法 在 多 项 式 运行 时 间 内 解决 ， 前 者 运行 速度 较 慢 ， 后 者 在 实际 应 用 中 与 单 工 
方法 一 样 具 有 很 强 的 竞争 性 。 

由 于 弄 懂 和 分 析 线性 问题 需要 用 到 较 多 的 数学 知识 ， 因 此 本 节 不 打算 讨论 一 般 的 线性 程 
序 设计 算法 。 但 是 ， 乔 清楚 线性 程序 设计 的 机 制 是 相当 重要 的 。 首 先 ， 了 解 某 给 定 问题 可 归 
为 多 项 式 规模 的 线性 程序 设计 问题 意味 着 对 这 一 问题 存在 一 多 项 式 时 间 的 算法 。 其 次 ， 存 在 
许多 线性 程序 设计 问题 的 特殊 情形 ， 对 这 些 情 形 存 在 速度 较 快 的 算法 。 例 如 本 节 所 述 ， 单 滨 
最 短路 径 问 题 是 线性 程序 设计 的 一 个 特例 。 还 有 其 他 一 些 问 题 也 可 以 归 为 线性 程序 设计 问 
题 ， 其 中 包括 单 对 结 点 间 的 最 短路 径 问 题 ( 见 练习 25.5- 和 和 最 大 流 问题 (练习 27.1-8)。 

有 时 我 们 对 目标 函数 并 不 关心 ， 只 希望 找 出 一 个 可 行 解 ， 即 满足 Ax<sb 的 向 量 xs 或 者 
确定 不 存在 可 行 解 。 后 面 一 个 我 们 将 着 重 讨 论 一 个 可 行 性 问题 ， 


善 分 约束 系统 . 


在 差分 约束 系统 中 ， 线 性 程序 设计 矩阵 A 的 每 一 行 包含 一 个 1 和 一 个 -1 A 的 所 有 其 
他 元 素 为 0。 因此， 由 Ax<b 给 出 的 约束 条 件 是 z 个 差分 约束 的 集合 ， 其 中 包含 m 个 未 知 
元 。 每 个 约 东 条 件 为 如 干 形式 的 简单 线性 不 等 式 : 

XI 一 Xi 雪 b 
其 中 1 所 ij 所 nm， 1 入 K 近 mm 
例如 ， 寻 找 一 个 和 维 向 量 x=(x) 以 满足 ， 


1 一 1 0 0 0 0 

1.0 0 0 -1|Tx 一 1 

心 1 “ 监 必 一 | x 

-1 0 1 0 0 1 5 

x，| < 

一 1 0 站 1 改 4 

0 0 -1 0 -1 

0 0 -10 1 5 一 3 

0 0 0 -1 1 一 3 

一 问题 等 价 于 找 出 未 知 量 x ,，i = 1，2，…5， 满足 于 列 8 个 差分 约束 条 件 : 

XI 一 X， 到 站 
X| 一 X, 入 一] 
X， 一 和 六 1 
X, 一 和 | 安 $ (25.4) 
X, 一 和 去 4 
x 一 X, 拟 一 1 


该 问题 的 一 个 管 案 为 x= (C-5，-3，0，-1，-4})， 这 可 以 直接 代入 每 个 不 等 式 而 得 到 验 ， 
证 。 实 际 上 该 问题 有 多 个 解 。 另 一 个 解 为 双 = 人 0，2，5，4。、1)， 这 两 个 解 是 有 联系 的 : x 中 
的 每 个 元 素 比 x 中 的 相应 元 素 大 5。 这 一 事实 并 不 仅仅 是 巧合 . 

引 理 25.46 设 x= 人 tx，z，…， 罗 是 一 关 分 约束 系统 Ax<b 的 一 个 解 ,d 为 任意 党 
数 。 则 x+td= (xi+d，xzHd，…，x+d) 也 是 该 系统 Axsb 的 解 。 

证 明 : 对 每 个 结 点 国 和 丙 ， 有 (00+d) 一 +d) 一 xx。 因 此 若 x 满 足 Axsb， 则 x+d 也 
同样 满足 。( 证 毕 ) 

差分 约束 系统 出 现在 很 多 不 同 的 应 用 领域 由。 例如， 未 知 量 x 可 以 是 事件 将 要 发 生 的 
时 刻 ， 每 个 约束 条 件 可 以 解释 为 某 一 事件 的 发 生 不 能 比 另 一 事件 的 发 生 晚 太 久 。 事 件 也 可 以 
是 代表 房屋 建设 过 程 中 要 完成 的 工作 。 如 果 控 地 基 的 工作 从 时 刻 x% 开始 ， 需 要 3 天 时 间 ， 
给 地 基 淡 铸 混 凝 土 的 工作 开始 于 时 刻 xx， 我 们 就 要 求 如 zxi+3 或 xi 和 和 -3。 因 此 ， 相 关 
的 时 间 约 束 条 件 可 以 看 作 一 个 差分 约 东 条件。 


约束 转 


用 图 形 理论 观点 来 解释 差分 约束 系统 是 很 有 益 的 。 在 一 差分 约 东 系统 中 ，nxaim 线性 规 
划 和 矩阵 A 可 以 被 看 作 有 T 个 缚 点 与 坦 条 边 的 图 的 一 个 关联 矩阵 ( 见 练习 23.1-7)。 对 i= 1， 
2，…，an。 图 中 的 每 个 结 点 对 应 于 a 个 未 知 变量 中 的 每 一 个 x。 图 中 的 每 条 有 向 边 对 庶 于 
mm 个 由 两 未 知 量 组 成 的 不 等 式 中 的 每 一 个 不 等 式 。 
更 形式 地 ， 已 知 某 差分 约 东 系统 Ax 和 b， 相 应 的 约束 图 为 一 有 疝 加 权 图 G=(V，D)， 
其 中 ， 
V= 一 tv Vi， V } 
下 一 {vi，vVi)xi 一 Xi 么 b 是 一 约束 条 件 } 





图 25.9 ”相应 于 佐 分 约束 系 统 (25.4) 的 约束 图 


引信 附 吉 早点 w 是 为 了 保证 其 他 每 个 结 点 均 从 w 可 达 。 因 此 ， 结 点 集合 由 对 应 于 每 
个 未 知 量 5 的 结 点 w 和 附加 的 结 点 ww 所 组 成 。 边 的 集合 E 由 对 应 于 每 个 差分 约束 条件 的 边 
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与 对 应 于 每 个 未 知 量 x 的 边 (vo， 由 所 构成 。 如 果 抽 -XS 和 bx 是 一 个 差分 约束 ， 则 边 (vi， 同 的 
权 wlvi，w)j=br。 从 ww 出 发 的 每 条 边 的 权 均 为 0。 图 25.9 说 明了 相应 于 (25.4) 的 卷 分 约束 夭 
统 的 约 东 图 。 每 个 结 点 中 显示 了 5(wo， 虽 的 值 该 系统 的 一 容许 解 为 x= (一 5， 一 3， 
六， 一 1 ， 一 4) ， 
下 面 的 定理 说 明 可 以 通过 在 相应 的 约束 图 中 找 出 最 短路 径 的 权 的 方法 ， 以 求 得 差分 约束 
条 统 的 解 。 
定理 25.17 ”已 知 差分 约 东 系统 Ax<b 设 G= cv， 下) 为 其 相应 的 约束 图 。 如 果 台中 
不 包 售 权 为 负 的 回路 ， 则 
X= (5fvo，v)，5(vo，Va)，Mvo，va，…，atvo，Vvn) (25.5) 
是 沪 系 统 的 可 行 解 ， 如 果 G 包含 权 为 负 的 回路 ， 册 该 系统 不 存在 可 行 解 
证 明 ; 首先 我 们 来 证 明 如 果 约 束 图 中 不 包含 权 为 负 的 回路 ， 则 由 (25.5) 给 出 的 等 式 是 问 
题 的 一 个 容许 解 。 考 虑 到 对 任意 边 (w，Vw)CE， 由 引 理 25.3 有 5(v，W) 和 5(vo，ViHwCvpw) 
或 ivo， 网 -6tve， 岗 乏 WVivi 因此 ， 天 一 ivu， 峭 ， = 区 vo，W) 满 中 对 应 于 边 (w， 则 的 
差分 约束 条 件 x 六 硬 科 Www Vi)。 
现在 我 们 证 明 如 果 约 束 图 中 包含 一 权 为 负 的 回路 ， 则 差分 约束 系统 无 可 行 解 . 不 失 一 般 
性 。 设 权 是 负 的 回路 为 se= <v，，…， 下 > 其 中 =ve( 结 点 而 不 可 能 在 回路 中 ， 因 为 没 
有 了 以 w 为 终点 的 边 }。 回 路 ec 对 应 于 下 列 的 差分 约束 条 件 : 
X 一 Xi 袜 WtY，YV， 加 
x, 一 X, 甩 W(v，， V)) 


X， 一 和 千惠 (w， Y，) 


X 一 X 所 W(v ，V) 

因为 xx 的 任何 解 均 需 同 时 满足 上 述 个 不 等 式 ， 因 此 也 必须 满足 把 上 述 k 个 不 等 式 相 
加 所 得 到 的 和 不等式。 如果 我 们 把 这 些 不 等 式 的 左 项 相 加 就 会 发 现 每 个 结 点 天 的 正 负 项 相 . 
抵 ， 结 果 堪 项 的 和 为 0， 而 右 项 的 和 为 .wlecj)， 因 此 有 0 科 w(ej。 但 由 于 ce 是 负 权 回路 ， 


wfoj<0， 因 此 x 的 任何 解 必须 满足 0<wtG)<0， 而 这 是 不 可 能 的 。( 证 毕 ) 
差分 约束 系统 问题 的 求解 


定理 25.17 告诉 我 们 可 以 采用 Bellman-Ford 算法 对 差分 的 约束 系统 求解 。 因 为 在 约束 
图 中 从 源 缚 点 wo 到 所 有 其 他 结 点 必 闻 均 存在 边 ， 因 此 约 东 图 中 任何 权 为 负 的 回路 均 从 可 
达 。 如 果 Bellman- Ford 算法 返回 TRUE， 则 其 最 短路 径 的 权 就 是 系统 一 可 行 解 。 例 如 在 
了 25.9 中 ， 由 最 短路 径 的 权 得 到 一 容许 解 x= (--5$，-3，0，~1，4)， 而 由 引 理 25.16， 对 任 
音 常 数 d，x=(d-5，d-3，d，d-1，d+4) 也 是 系统 的 可 行 解 如果 Beliman-Ford 算法 返 
党 开 ALSE， 则 对 差分 约束 系统 不 存在 可 行 解 。 

关于 是 个 未 知 量 的 m 个 约 东 条 件 的 一 个 差分 级 东 系 统 产生 出 一 个 具有 n+l 个 结 所 和 
nm 条 边 的 图 ， 因 天 此 采用 Belimnan-Ford 算法 解决 这 一 问题 ， 其 运行 时 间 为 
Ofn+LXn+Hmh=On Him)。 练 习 25.5 一 5 中 将 要 求证 明 即使 mm 远 小 于 nm， 算法 的 实际 运行 
时 间 仿 为 Oomnj。 
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思 考题 


25S-1 对 Beliman 一 Ford 算法 的 Yen 氏 改 进 


假设 我 们 对 Belliman-Ford 算法 每 一 越 中 边 的 松弛 顺序 作 如 下 安排 ， 在 第 一 趟 执行 之 
前 ， 我 们 把 一 任意 线性 序列 v，v，…，vw 财 值 给 输 和 人 图 G=(V， 朋 的 各 个 结 点 。 然 后 把 
按 的 集合 瑟 分 为 HI JE， 其 中 Er= fw， 站 GEEi<j，E={w，w5 Ei> 并 。 定 义 Gr=(V， 
ED)，G,=(V，EJ)， 

a. 证 明 对 拓扑 序列 <vi，w。， 人 …， 驯 W>， Gr 是 无 回路 图 ， 对 拓扑 序列 <wv，wwPn 
…，Vi>，Go 是 无 回路 图 。 

假设 我 们 对 Beliman 一 Ford 算法 中 的 每 _- 直 按 下 列 方法 实现 . 按 ，， v，…，YVvl 的 顺序 
访问 每 个 绪 氮 ， 同 时 对 从 该 结 点 出 发 的 Br 中 的 边 进行 松弛 。 然 后 再 按 vvw，vwr-i，…，Ww 的 
顺序 访问 每 个 结 点 ， 同 时 对 从 该 结 点 出 发 的 Eu 中 的 边 进行 松弛 。 

b. 证 明 在 这 一 方案 中 ， 如 果 G 不 包含 从 源 结 点 s 可 达 且 权 为 负 的 回路 ， 峙 对 边 仅 执行 
[7 2 ] 直 操作 后 ， 对 所 有 结 点 YEV 有 dvj=5s， 了 )。 

5. 这 一 方案 对 Bellman 一 Ford 算法 的 运行 时 间 有 何 影响 ? 


2S-2 散 桔 框 


如 果 存 在 时 ，2，…， 几 上 的 某 一 排列 r， 满 足 zar0<y， xm<y，…，x<yw， 则 称 
一 个 d 维 框 (x,，x，…，xa) 寻 人 另 一 4 知 征 Gu， ya，…，yd 中 。 

a, 证 明报 套 关 系 具 有 传递 性 。 

b. 描 述 一 有 效 算 法 以 确定 某 d 维 框 是 否 艇 套 于 另 一 d 维 框 中 。 

c. 假 定 给 出 一 个 由 个 d 维 框 组 成 的 集合 {B，B2，…，B,j， 写 出 一 有 效 算 法 以 找 出 满 
足 条 件 B， 嵌 人 吾 ，j= 1，2，…，krl 的 最 长 嵌 套 框 序列 <B， ，Bi ，…， Bi，> 。 用 变 


量 n 和 d 来 描述 所 给 出 的 算法 的 运行 时 间 。 
25-3 村 汇 问题 


亡 汇 是 指 利用 货币 汇总 率 的 差异 把 一 个 单位 的 某 种 货币 转换 为 大 于 一 个 单位 的 闻 种 货币 
的 方法 ， 例如， 假定 1 美元 可 以 买 0.7 镑 ，1 镑 可 以 买 9.5 法 国法 郭 ，] 法 郎 可 以 买 0.16 美 
元 。 通 过 货币 兑换 ， 一 个 商人 可 以 从 1 美元 开始 买 人 ， 得 到 0.7x9. 5x0 16= 1.064 美元 ， 
因而 获得 6.4% 的 利润 。 

假设 已 知 虽 种 货币 ce，c，…:， ca 和 有 关 总 换 率 的 mxn 表 屎 ， 一 单位 货币 c 可 以 买 
Ri，j 单 位 的 货币 c。 -: 

3a. 号 出 一 有 效 算 法 ， 以 确定 是 否 存 在 一 货币 序列 <c > 满足 ， 


RE i] - Ri， 定 :RE _ ii] - RG il> 1 


并 分 析 你 的 算法 的 运行 时 间 。 
b. 写 出 一 有 效 算 法 以 打印 出 该 序列 (如 果 它 存在 半分 抽 算 法 的 运行 时 间 。 
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25-4 关于 单 源 最 短路 径 的 Gabow 定 标 算法 


定 标 算法 是 按 如 下 方式 对 问题 进行 求解 ， 开 始 时 算法 仅 考 虑 每 个 相应 输入 值 的 (例如 一 
条 边 的 权 ) 最 高 位 ， 接 着 算法 通过 查看 最 高 两 位 对 初始 答案 进行 精 化 ， 这 样 逐 步 查看 更 多 的 
最 高 位 信息 ， 同 时 每 次 均 对 前 面 的 解答 进行 精 化 , 直至 所 有 位 均 被 考虑 在 内 并 且 正 确 答案 得 
出 为 止 。 四 

在 这 一 问题 中 ， 我 们 考察 一 种 通过 对 边 的 权 进 行 定 标 操作 而 计算 单 源 最 短路 径 的 算法 。 
给 定 近 的 权 为 非 负 整数 的 有 向 图 G=(V，E)， 设 W=maxowweefw(u，vj， 我 们 的 目标 是 开 
发 一 种 运行 时 间 为 O(E lg W) 的 算法 。 

该 算法 对 边 的 权 的 二 进 制 表示 ， 从 最 和 有 北 位 到 最 低 有 效 位 每 区 检查 一 位 。 我 们 设 玉 
= Tig(W+1) 1 是 W 的 相应 二 进 制 数 的 位 数 且 对 ji= 1，2，…，k， 设 w,(uy v) 
=Lw(a， mm72 4 。 这 就 是 说 wif(u， 人 是 由 wu， 玉 高 i 位 有 效 位 对 w(u， 宁 “ 按 比 例 
缩小 ”的 撒 述 (因此 对 所 有 (na，v)eE，w (au，7)= wu，7])。 例 如 ， 若 k= 5，w(u，v) 
=25， 其 相应 的 二 进 制 数 为 <.11001> ， 则 wu ，W= 一 <110> 三 6。 又 如 对 K 一 5， 
大 wu， 由 = <00100> =4， 蓝 wa 纹 = <001> =1。 我 们 定义 5 (u，V) 为 用 加 权 郴 
数 w, 计算 出 的 从 结 点 到 结 点 "的 最 短路 径 的 权 。 因 此 对 所 有 u，vseV， 有 5 (au，v) 
= 6，v)。 对 于 一 指定 源 结 点 s， 定 标 算法 首先 对 所 有 veV 计算 出 最 短路 径 的 
权 5,(s，v)， 接 着 对 所 有 veV 计算 出 6.(s，yY)， 如 此 下 内 直至 对 所 有 veV 计算 
出 5 GG， 人 内。 假定 在 整个 计算 过 程 中 |B>jVi 一 1， 并 且 我 们 将 看 到 从 5，, 计算 出 5, 需要 
运行 时 间 OUE)， 所 以 整个 算法 的 运行 时 间 为 OKE) = D(ElgW). 

a. 假 设 对 所 有 结 点 v&V， 有 5s， 妇 所 | 是 。 证 明 对 所 有 vEYV， 我 们 可 以 在 OUB) 的 运行 
时 间 内 计算 出 SG， 人。 

b. 证 明 对 所 有 v6 V， 我 们 可 以 在 DIE) 的 运行 时 间 内 计算 出 .its， 人 内 。 

现在 我 们 集中 注意 力 看 看 如 何 从 5 计算 出 6i。 

,证 明 对 i=2，3，…，Kk， 要 和 Wi(u， 凡 =2wi fu，W， 要 公有 wa， 由 = 2w 0u， 


V)+1。 的 后 再 证 明 对 所 有 YECYVY， 有 
26， (SS， 如 所 5 (3， 臣 过 20，G 本 汉 一 1 


d. 对 ji=2，3，…, & 和 所 有 边 (u，v)sE， 我 们 定义 W (u，v) = w,(u，v) 
二 26 (ss， 则 一 25 (5， 凡 。 证 明 对 1 一 2，3，…， 帮 和 所 有 u，veV， 边 吕 ， 中 被 再 加 
权 ” 的 权 值 w (aa， 是 非 抽 整数 ， 

e. 现在 我 们 定义 5; (s， 人 0) 为 使 用 加 权 函 数 w 的 从 s 到 *v 的 最 短路 径 的 权 . 证 明 对 j 
一 2，3，…, 友和 所 有 vEV， 有 

(8， 从 =5 fs， 内 十 25，，(s， 1W 

且 6 (G，m) 芭 旧 | 

f 说 明 对 所 有 YesV， 如 何在 DB) 的 运行 时 间 内 根据 5 _,， 凡 计算 出 5 (6、V)， 并 推 
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断 出 对 所 有 veY 可 以 在 O(E 起 W) 的 运行 时 间 内 计算 出 ksyv)，， 
25 一 5 kanp 最 小 平均 权 回 路 算法 


设 G= (Y,E) 是 加 权 函 数 为 wER 的 有 回 图 , 且 一 |vh 定 义 中 某 回路 一 《elvey， 
的 各 为 


RKCe 一 二 won 


设 旧 一 ininehfc》， 其 中 的 到 值 范围 为 G 中 的 所 有 有 疝 可 路 。 满 足 hc) 一 喇 的 回路 e 称 
为 最 小 平均 权 公 路 。 本 问题 中 将 寻求 一 有 效 算 法 来 计算 属 " 。 

假定 不 失 一 般 性 ,每 个 结 点 vEY 均 从 某 字 结 点 sEY 可 达 , 设 5s,v) 为 从 s 到 v 的 最 短 
路 径 的 权 , 生 各 (av) 为 从 s 到 v 仅 由 上 条 边 组 成 的 一 最 短路 各 的 权 。 若 从 s 到 v 不 存在 仅 由 
k 条 过 组 成 的 通路 , 财 &(syv) 一 co。 

a 证明 若 曰 一 0, 则 G 不 包含 权 为 负 的 回路 且 对 所 有 结 点 vEV, 有 5(syw) 一 minoccs 
如 SevV) 。 

b. 证 明 者 上 一 0, 则 对 所 有 结 点 v 名 V, 有 

5 (s,v)-- 二 >0 
人 sa 一 上 卫 一 上 上 

(提示 :应 用 (a)? 中 的 两 性 质 ) 

#. 设 * 为 基 权 为 0 的 回路 ， 是 u 和 是 回路 < 中 的 任意 两 个 结 点 ， 介 定 滑 回路 上 从 到 
_Y 的 通路 的 权 为 x， 证 明 :; 5(sy,v) 一 5syu) 十 x。 
提示 洗 回 路 从 v 到 sa 的 通路 的 权 为 一 3 

d. 证 明 关 哺 一 0, 则 在 最 小 f 均 权 回 路 中 存在 一 缚 点 v, 清 足 ， 


各 (sy) 一 把 (syv) 一 0 
DeEn 一 上 太一 四 


《提示 : 证 明 在 到 达 最 小 平均 权 回 路 中 任何 结 点 的 一 条 最 短路 径 可 洪 回 路 被 东 长 ， 从 而 以 取 
得 一 条 到 达 该 同 路 中 下 一 个 结 点 的 最 短路 径 ) 
ee 证 明 大 上 一 0, 册 
btayvy) 一 htsrv 0 


后 二 一 上 着 一 长 


f. 证 明 若 我 们 把 G 中 每 条 边 的 权 加 上 一 常数 区 则 也 增加 t+。 运用 这 -结果 证 明 ， 


Unag max 和 (Siv) 一 asyy) 
丰 Y De 一 1 卫 一 攻 


g- 写 出 一 运行 时 间 为 O(CYVE) 的 算法 来 计算 是 


“练习 二 十 五 


25. 1 一 1 上 除 图 中 马 站 出 的 两 棵 树 以 外 ,另外 再 西 出 两 标 图 25. 2 所 示 有 人 疝 图 的 最短 路 径 树 。 
25. 1 一 2 举 一 有 向 训 权 图 的 实例 G 一 (V,E) ,其 加 权 函 示 为 wuE-*R， 且 锋 结 点 为 要 求 注 足 下 列 性 
质 : 对 每 条 边 {ayv) E E, 存在 一 包 售 (orv) 上 丙 s 为 根 的 最 短路 径 树 ,同时 也 存在 另 一 棵 以 8 为 根 但 不 包 舍 
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tu， 人 吃 的 最 短路 径 树 . 

25.1-3 ”对 直 理 25.3 的 证 明 过 程 稍 作 渔 色 . 使 其 在 最 短路 径 的 权 为 ce 或 -cc 时 也 能 证 明 避 理 的 正确 性 ， 

25.1-4 设 G=(V，RF) 基 有 向 加 权 图 ， 源 点 为 s， 并 设 扣 由 过 程 INITIALLZE- SINGLE 一 
SOURCE(G， 引 进行 了 初始 化 。 证 明 如 果 经 过 一 系列 松弛 操作 ， 砷 的 值 被 置 为 非 NIL， 则 G 中 包 篆 一 个 
权 为 负 的 回 栈 ， 

25.1-5 设 台 =(V，B) 为 有 向 加 权 图 且 不 售 权 为 全 的 边 。 设 sEY 为 源 结 点 且 xi 和 朋 常 一 样 定 尽 : 若 Y 
fV-{s} 为 从 5 可 达 的 结 点 ， 则 fw] 是 从 源 到 v 的 某 最 给 路 径 中 结 点 v 的 先 非 ， 否 则 xl 为 NIL。 娃 一 例 
说 明 可 在 G, 中 产生 回路 的 这 样 一 个 图 G 以 员 相 应 对 * 的 赋值 。( 根 据 引 悍 25.8 可 知 ， 这 样 一 种 赋值 不 可 能 
由 一 个 松 名 操作 序列 所 产生 。) 

25.1-6 设 G=(V， 杞 是 有 向 加 权 图 ， 其 加权 函数 WiE-* 有 R， 且 图 中 不 包 依 权 为 负 的 回路 。 设 sEY 为 
源 结 点 及 总 由 TNITIALIZE-SINGLE-SOURCEIG， 匀 进行 了 初始 化 。 证 明 对 每 一 结 点 vEV， 各 , 中 存 
在 一 条 从 到 Y 的 通路 , 且 经 过 任意 序列 的 松弛 操作 这 一 性 质 依 热 保 持 成 立 。 

25.1-7 设 G=(V，B) 为 有 夫 加 权 上 图 ， 其 中 不 包含 权 为 负 的 回路 ，sEY 为 源 结 虚 。 右 由 
INITIALIZB-SINGLE -SOURCE(G， 久 进 行 了 初始 化 ， 证 明 对 所 有 KE V， 存 在 一 个 |VI-1 步 的 松弛 序 
列 ， 使 得 dlvj= As，v)。 

25.1-8 设 忆 为 任意 的 有 向 如 权 图 ， 且 存在 一 从 源 结 点 8 可 达 的 权 为 仙 的 加 路。 证明 对 @ 的 边 总 可 以 
构造 一 元 限 的 松弛 序列 ， 使 得 每 个 松弛 步 都 能 对 最短 路 径 估计 进行 修改 . 


25.2-] 用 结 点 s 和 结 点 y 分 划 作 为 着 结 点 ,， 对 图 25.2 所 示 的 有 向 图 运行 Dijkstra 算法 . 利用 图 | 25. 5 
所 未 的 方式 ， 说 明 在 while 循环 的 每 次 选 代 后 的 4 和 值 以 及 集合 8 中 的 结 点 。 

25.2-2 给 出 一 合 有 负 权 地 的 有 向 图 的 简单 实例 说 明 Dijkastra 算法 对 其 运行 会 产生 错误 的 结果 、 1 在 多 
许 图 中 过 的 权 为 负 时 为 什么 定理 25.10 的 证 明示 能 成 立 ? 

25.2-3 ” 恨 设 将 Dijkstra 算法 的 第 4 行为 改 为 ; 

4、while |Q> 1 
这 一 修改 使 得 while 钉 环 执行 |[Vj-1 次 而 不 是 Yi| 葡 ,是 可 正 兢 ? 

25.2-4 已 知 一 有 癌 图 各 =( 人 W， 了 一 ， 对 其 每 条 边 (0， 人 内 二 均 对 应 一 实 雪 值 ra， 表示 愉 结 点 口 到 
结 点 v 的 通信 线路 的 订 莫 性， 到 值 范围 为 0 和 rtu，V) 和 1。 我 们 定义 ru，y) 为 从 到， 的 线路 不 中 疡 的 概 
率 并 假定 这 些 概 率 是 相互 独立 的 。 宕 出 一 有 效 算法 找 出 两 指定 结 点 向 的 最 可 车 的 线路 ， 

25.2-5 设 避 为 月 僻 加 权 图 ， 加 权 奖 数 为 WE-~i 和 和 ，1，…，W-1，W 为 某 一 非 负 整 数 . 禾 改 
Dijkstra 算法 以 使 其 计算 从 指定 源 结 点 s 的 最 短 踪 路 所 需 的 运行 时 间 为 D(WYV+E)， 

25.2~6 由 改 练习 25.2-5 中 算法 使 其 运行 时 间 为 OKX(V+E) LI WW)， 朋克 在 任意 时 刻 集合 V-S 中 可 能 
存在 多 少 不 同 的 最 短 耻 径 估计 93) 


25.3-1 用 结 点 y 作为 诬 缚 点 ， 对 图 25.7 所 示 的 有 疝 图 运行 Bellmar 一 Ford 算法 。 在 每 趟 操作 中 按 启 
典 显 漳 对 这 进行 松 驰 ， 并 指出 经 过 等 一 示 以 后 的 d 秆 和 值 。 现 在 把 边 (9y， 的 权 改 为 4 并 把 z 梓 为 流 结 点 
再 运行 该 算法 ， 结 果 如 何 ? 

25.3-2 证明 推 论 25.13。 

25.3-3 已 知 某 木 含 负 权 阿 路 的 有 向 加 权 图 台 =(Y，E)， 设 对 于 所 有 结 点 对 U，YEV， 王 是 从 到 Y 
具有 最 少 边 数 的 最 短路 径 所 包 合 的 过 数 的 最 大 值 。( 这 里 ， 最 短路 径 是 对 其 权 而 不 是 其 包含 的 边 数 来 说 的 )。 
试 区 Belmapn-Ford 等 法 作 简 单 变 换 使 其 可 在 m+t 趟 操作 中 完成 计算 。 

25.3 一 4 收 改 Beilman 一 Ford 竺 法， 使 其 对 所 有 销 点 v， 著 从 源 结 点 到 v 的 某 条 通路 上 存在 一 权 为 负 的 
回路 ， 则 算法 痪 d[v]* 一 cc。 

25.3-5 设 操 =(Y，E) 为 有 向 加 权力 ， 加 松 卫 数 wiR-= 及 ， 耳 出 一 运行 时 间 为 O(VE) 的 算法 ， 对 每 个 
结 点 vEY 求 得 到 人 =min vvf5tu，w 妇 的 性。 

25.3-6+ 扔 定 某 有 内河 权 恒 外 人 Y， 于 手语 民 志 组 的 则 路 2 下 一 有 肖 算 法 列 出 湾 回 路 上 的 所 有 
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结 点 并 证 明 算法 的 正确 性 . 


25.4-+ 用 结 点 T 作 为 法 结 点 ， 对 图 25.8 所 示 的 有 向 图 运行 DAC-SHORTEST-PATHS。 
25.4-2 但 设 我 们 把 DAG-SHORTEST-PATHS 的 第 3 行 修改 碟 . 
3， 和 or 拓扑 序列 中 的 前 面 广 ! 个 结 点 - 

， 诬 明 经 修改 后 的 过 程 依然 正 奖 。 
， 235.4 -3 从 某 种 音义 上 来 说 ， 上 面 对 PERY 图 的 阑 述 是 较 般 强 的 。 如果 用 结 点 代表 工作 ， 边 代表 有 序 
的 约束 ， 即 边 恪 ， 妇 表示 工作 u 必须 在 工作 v 之 前 完成 ，PERT 图 的 定义 就 自然 多 了 。 这 样 权 将 赋 绽 结 点 
”而 钞 是 赋 纵 边 ， 修 改过 程 DAG-SHORTEST-PATHS， 使 其 能 计算 出 具有 有 权 结 点 的 有 向 无 回路 图 中 的 
最 长 足 径 ， 上 要求 算法 的 运行 时 间 基 线性 的 。 

25.4 一 4 4 有关 提 基 洒 统计 有 门 无 问 路 图 中 的 全 部 路 径 数 ， 分 析 所 给 出 的 竺 法 并 评价 其 可 行 性 . 


25.5 一 | 对 下 列 关 分 的 宁 系统 拒 出 其 可 行 解 或 说 明 不 \ 存 在 可 行 解 . 


天 一半 
X| 一 之 一 中 
Xi 一 于， 二 之 
一 
X 3 一 Xi 之 5 
Xi; 一 Xu 宝 1 
X4 一 X 安全 
天， 一 革 | 扫 一 1 
Xi 一 X 有 3 
Xi 一 大; 等 一 外 
25.5 一 2 ”对 下 列 益 分 约束 系统 找 出 -可 行 解 或 培 明 不 存在 可 行 名 
和 一 X。 之 才 
X| 一 Xi 反 5 
X; 一 X4 苹 … 咎 
X; 一 Xy 有 | 
X4 一 X| 安 了 
X， 一 Xi; 天 5 
X4 一 X 委 1 
Xi 一 Xi 妆 一 人 
Xi; 一 X 之 一 站 
25.5-3 在 约束 图 中 从 新 结 点 wm 出 发 的 最 短路 径 的 权 是 否 醋 以 为 正 数 ? 试 说 明之 ， 
25.3~4 ”试用 线性 程序 设计 方法 来 表述 单 对 结 点 癌 的 量 类 路 径 问 题 。 
25.$-5 试 对 Bellman 一 Ford 算法 稍 作 修改 ， 使 居 在 子 求 关于 个 未 知 最 的 巴 个 不 等 式 所 定义 的 营 务 
约束 系统 的 解 时 ， 其 运行 时 间 为 Dlmn).。 
25.5-6 说 明 如 何不 用 附加 结 点 w 而 对 纳 束 图 运行 Bclman-~Ford 竺 法 从 而 求 得 莹 分 约 划 系 锭 的 解 。 


25. 和 -7* ” 设 Axsb 是 关于 nm 个 未 知 量 的 in 个 约束 条 件 的 差分 约 东 系统 。 证 明 对 其 相应 的 约束 图 运行 
Bellman 一 Ford 算法 ， 可 坟 求 得 满足 Ax<b 旦 对 所 有 5 有 Xi 和 0 的 式 2,_ ,xi 的 最 大 值 。 


25.5$-8*+ ”证 明 Bellman 一 Ford 算法 在 差分 约束 系统 Axshb 的 约束 图 上 运行 时 ， aa 
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取得 满足 Axshb 的 景 小 值 。 当 该 算法 被 用 于 安排 建设 工程 的 进度 时 ， 请 说 明 如 何 应 用 上 述 事 实 ? 

25.5-9 假设 线性 程序 Axs<hb 中 和 矩阵 A 的 每 一 行 对 应 于 一 个 差分 约束 条 件 ， 即 形 如 古 所 ph 或 - 实 忆 
的 单 变量 的 约束 茶 件 ， 说 明 如 何 修改 Beliman-Ford 算法 以 求 得 这 种 约束 系统 的 解 。 

25.5-10 ”假设 除 差 分 约束 系统 外 ， 我 们 希望 也 能 对 形 ， 如 为 = 轨 Hbx 的 等 式 约 束 茶 件 进行 处 理 ， 说 明 如 
何 修 改 Beliman 一 Ford 算法 以 求 得 这 种 约束 系统 的 租 。 

25.5-11 对 所 有 bb 的 元 素 均 为 实数 且 折 有 未 知 量 xx 必须 是 整数 的 情形 写 出 一 有 效 算 法 以 求 得 差分 的 约 
东 系 统 Axsb 的 解 。 四 


25.5~12* ”对 所 有 bb 的 元 素 均 为 实数 且 部 分 (不 一 定 是 全 部 ) 末 知 量 5 为 整数 的 情形 写 出 一 有 效 算 法 以 
求 得 闫 分 约 东 系统 Axsb 的 解 。 
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第 二 十 六 章 ”每 对 结 点 间 的 最 短路 径 


在 本 章 中， 我 们 要 讨论 找 出 图 中 每 对 结 点 间 最 短路 径 的 问题 。 这 个 问题 在 实践 中 常常 会 
出 现 。 例 如 ， 对 一 公路 图 ， 要 造 表 说 明 其 上 每 对 城市 间 的 距离 时 就 可 能 出 现 这 种 问题 。 与 二 
十 五 理 中 一 样 ， 给 定 一 有 向 加 权 图 G=(V,E}， 其 加 权 函 数 w。 E-* 愉 为 从 边 到 实数 型 权 的 
脆 射 。 对 于 每 对 结 点 uvE V， 我 们 希望 找 出 从 平 到 v 的 一 条 最 短 (最 小 权 ) 路 径 ， 其 中 路 各 
的 权 是 指 其 组 成 边 的 权 之 和 。 我 们 特别 希望 以 表格 形式 输出 结果 : 第 行 第 " 列 中 的 元 素 

应 是 从 u 到 v 的 最 短路 径 的 权 。 

可 以 把 单 源 最 短路 径 算法 运行 |V| 次 来 解决 每 对 结 点 问 最 短路 径 问 题 ， 每 次 依 序 把 图 中 
的 每 个 结 点 作为 源 点 。 如 果 所 有 边 的 权 为 非 偶 ， 可 以 采用 Dilkstra 算法 。 如 果 采 用 线性 数 
组 来 实现 优先 队列 ， 算 法 的 运行 时 间 为 O(VHVB)= O(V3)。 如 果 是 稀疏 图 ， 采 用 二 又 堆 来 
实现 优先 队列 就 可 以 改进 算法 的 运行 时 间 为 O(VE 翅 V)。 或 者 , 我 们 可 以 采用 Fibonacci 堆 
来 实现 优先 队列 ， 其 算法 运行 时 间 为 O(V2lg V+VB)， 

如 果 允 许 有 权 为 负 的 边 存在 ， 就 不 能 采用 Dijkstra 算法 ， 我 们 必须 对 每 个 结 点 运行 一 
次 速度 较 慢 的 Bellman- Ford 算法 ， 其 运行 时 间 为 O(V?E)， 对 稠密 图 则 为 O(V9)。 在 本 章 我 
们 将 看 到 如 何 来 更 好 地 解决 这 个 问题 ， 我 们 也 将 探讨 每 对 结 点 间 的 最 短路 径 问题 与 矩阵 染 法 
的 关系 ， 并 学 习 其 代数 结构 。 

在 前 面 的 单 源 算法 中 ， 都 假定 采用 图 的 邻接 表 表 示 法 。 与 此 不 同 ， 本 章 中 的 大 多 数 算法 
均 采用 邻接 矩阵 表示 法 (关于 稀 琉 图 的 Johnson 算法 采用 邻接 表 )， 其 输入 是 一 个 nxn 矩阵 
W， 用 来 玫 示 个 结 点 的 有 向 图 G= (Y.) 中 于 的 可 ， 即 W 一 (wj， 其 中 
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w ,= 有 向 边 人 j) 的 权 车 关 j 且 (ij)eB 0260 
的 逢 关 j 且 (GE 
允许 存在 权 为 负 的 边 ， 伍 目前 我 们 假定 输 和 人 图 中 不 包含 权 为 负 的 回路 。 
本 章 中 每 对 结 点 间 最 短路 径 算法 的 输 旨 是 一 个 nxa 矩阵 了 D= (dj， 其 中 册 是 从 1 到 j 
的 最 短路 径 的 权 。 邑 如 果 我 们 用 i 办 表示 从 结 点 ji 到 结 点 j 的 最 短路 径 的 权 ( 如 第 二 十 五 章 
中 那样 )， 购 在 算法 终止 时 省 = 56. 
为 了 解决 输 和 人 为 邻接 矩阵 的 每 对 续 点 偶 最 短路 径 问 题 ， 不 仅 要 算出 最 短路 径 的 权 ， 而 且 
要 计算 出 先辈 矩阵 r= (ri)， 其 中 若 i=j 或 从 i 到 j 没有 通路 ， 则 症 为 NIL， 否 期 四 表示 从 
ji 出 发 的 最 短路 径 上 上 j 的 某 个 先 磊 ， 正 如 第 二 十 五 章 中 所 述 先辈 子 图 G,. 是 以 已 知 冰 结 点 为 根 
的 一 棵 最 短路 径 树 ， 由 矩阵 第 i 行 归纳 出 的 子 图 应 是 以 i 为 根 的 一 棵 最 短路 径 树 。 对 每 个 
铺 点 iEV， 我 们 定 尽 台 对 于 站 的 先辈 子 图 为 。i=(V ED)， 其 中 
Vi=GEV: 大 NILIU 生 
Eui= 区 ri: jgVa 且 西关 NIL) 
好 果 台 ,; 是 一 棵 最 短路 径 树 ， 则 下 列 过 程 将 打印 出 从 结 点 直到 结 点 j 的 一 条 最 短路 径 ， 
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该 过 程 是 由 第 二 十 三 章 中 的 过 程 PRINT-PATH 修改 而 成 的 。 
PRINT--ALL-PAIRS-SHORTEST-PATHCxsi) 
1 让 i=j ， 
2 then printi 


3 else 这 mi 一 NIL 
不 then Print*nao path from ito "jexiatS” 。 
5 else PRINT-ALEL-PAIRS-SHORTEST-PATHCrci zy) 


6 Print j 


为 了 突出 本 章 中 每 对 结 点 算法 的 本 质 特征 ,我 们 不 可 能 僚 第 二 十 五 章 阐述 先辈 子 图 那样 
花 大 量 简 幅 去 讨论 先 非 矩阵 的 建立 及 其 性 质 。 基 础 知识 将 在 某 些 练习 中 讨论 。 


本 童 概述 


26.1 节 阐 述 了 基于 和 矩阵 乘法 的 动态 程序 设计 算法 , 这 种 算法 可 以 解决 每 对 结 点 间 最 短路 
径 间 题 。 由 于 采用 了 "反复 平方 "(repeated squaring) 的 技术 ， 算 法 的 运行 时 间 为 @(V'lg V)。 
26.2 节 给 岂 了 嚼 一 种 动态 规划 竺 法 ， 即 Floyd-Warshall 算法 。 该 算法 的 和 撑 行 时 间 为 
@@(V3)。26.2 节 中 还 讨论 了 求 一 有 向 图 传递 闭 包 的 问题 ， 这 一 问题 是 与 每 对 结 点 间 最 得 路径 
相 联 系 的 。26.3 节 朵 述 了 Johnson 算法 。 与 本 章 中 其 他 算法 不 同 ，Johnson 算法 采用 图 的 邻 
接 表 表 示 法 。 用 该 算法 解决 每 对 结 点 介 最 短路 径 问 题 所 希 运行 时 间 为 O(V "lg V+VE)， 对 大 
型 稀 蕊 图 来 说 这 是 一 个 很 好 的 算法 。 最 后 , 在 26.4 节 中 我 们 将 讨论 一 种 称 之 为 “ 闭 半 环 "的 
代数 结构 ， 这 一 结构 使 得 很 多 最 短路 径 算法 可 以 应 用 于 大 量 的 与 最 短路 径 无 关 的 其 他 类 型 的 
每 对 结 点 问题 。 

在 继续 冰 述 之 前 ， 有 必要 对 邻接 矩阵 表示 法 建立 一 些 约 定 。 首 先 ， 我 们 一 般 假 定 输 人 图 
G=(V.E) 有 nm 个 结 点 ， 所 以 na=|Vi， 其次， 我 们 将 按 常 规 用 大 写字 母 来 表示 乍 阵 ， 例 如 W 
或 D， 而 用 带 有 下 标的 小 写字 母 来 表示 矩阵 的 元 素 ， 如 wi 或 dj。 有 些 和 矩阵 表示 中 有 带 插 号 


的 上 标 ， 如 Dm= ( df” }， 用 来 表明 迭代 过 程 。 最 后 ， 对 -给 定 nxan 矩阵 A， 我 们 假定 n 
的 值 存 于 属性 rows[A] 中 。 


26.1 最短 路径 与 矩阵 乘法 


本 节 要 介绍 用 来 解决 每 对 结 点 间 的 最 短路 径 问 题 的 关于 有 向 图 G=(V, 卫 的 一 个 动态 规 
划算 法 ,动态 程序 设计 的 每 个 主要 循环 中 将 引发 一 个 与 矩阵 萎 法 运算 十 分 相似 的 操作 ， 因 此 
算法 看 上 去 很 像 是 重复 进行 的 矩阵 乘法 运算 。 我 们 开始 时 先 找 出 一 种 运行 时 间 为 B(V ) 的 竺 
法 来 解决 每 对 结 点 间 的 最 短路 季 问 题 ， 然 后 改进 算法 使 其 运行 时 间 达 到 @(VtgV)。 

在 继续 上 述 之 前 ， 让 我 们 扼要 重 述 第 十 六 章 中 给 出 的 升 发 动态 程序 设计 算法 的 几 个 步 
缀 : 

1. 刻 划 出 最 理想 解法 的 结构 。 

2. 对 最 理想 解法 的 值 进行 递归 定义 。 

3. 按 自 底 从 上 方式 计算 最 理想 答案 的 值 。 

(第 4 步 : 从 计算 出 的 信息 中 构造 最 理想 解法 ， 将 在 练习 中 讨论 。 ) 
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最 短路 径 的 结构 


我 们 先 来 刻 划 最 理想 解法 的 结构 。 对 于 图 G = (V,E) 上 每 对 结 点 则 的 最 短路 径 问题 ， 
我 们 已 在 引 理 25.1 中 证 明 最 短路 径 的 所 有 子路 径 也 是 最 短路 径 . 假定 图 以 邻接 夭 阵 到 
= (wj) 来 表示 。 考察 从 结 点 i 到 结局 j 的 一 条 最 短路 径 p。 假 设 p 至 多 包含 条 边 ， 且 图 


中 不 存在 权 为 负 的 可 路 ， 则 必 为 一 有 限 值 。 如 果 i=j， 岸 路 径 p 中 没有 边 且 其 权 为 0。 


若 结 点 i 和 结 点 j 是 相 蜡 结 点 ， 则 我 们 把 路 径 p 分 解 为 1 Kk 一 j。 其 中 路 径 p' 至 多 包含 严 
一 1 条 边 ， 此 外 由 引 理 太 .1， p “是 从 i 到 k 的 一 条 最 短路 径 。 因此 由 推论 25.2， 我 们 有 50) 
= 6 汪 十 wu - 


解决 每 对 结 点 间 的 最 短路 径 问题 的 一 种 递归 方法 


现在 设 d ”是 从 结 点 到 结 点 的 至 多 包含 四 条 边 的 任何 路 径 的 权 的 最 小 值 。 当 im=0 
时， 从 1 全 合作 拒 和 作 当 | i 王 j。 因 此 


d-{a 车 ixj 
对 症 > 1， 先 计算 dy (从 i 到 j 训 多 包含 中 一 1 条 近 的 最 短路 径 的 权 )， 从 ii 到 j 的 
至 多 包 售 mm 条 边 的 任何 路 径 的 权 的 最 小 值 ， 取 两 者 中 的 最 小 值 作为 4 ,。 因 此 我 们 遂 归 
定 尽 : 


de 一 min (ay "min ae 十 Ww | ) 

= min face +wu | (26.2) 
后 一 等 式 成 立 是 因为 对 所 有 jw = 0， 

那么 什么 是 实际 最 短路 径 的 权 50j) 呢 ? 如 果 罗 中 不 包含 权 为 负 的 回路 ， 则 所 有 最 短路 
径 都 是 简单 路 径 ， 从 而 至 多 包 依 a- 1 条 边 . 从 结 点 i 到 结 点 j 的 多 于 mn 一 上 条 边 的 路 径 其 
权 趟 可 能 小 于 从 i 到 ji 的 最 短路 径 的 权 。 实 际 最 短路 径 的 权 而 由 下 式 给 出 : 


ED=dp = 一 dj 一 dy 一 … (26.3) 
自 订 向 上 计算 最 短路 径 的 权 
把 矩阵 W = (w,) 作为 输入 ， 我 们 现在 来 计算 一 组 抢 阵 D0，D”，…,D”"。 对 症 
= 12…，a 一 1 有 DP = (dy )。 最 后 一 个 矩阵 D” ”包含 有 实际 最 短路 径 的 权 。 注 
意 ， 关 为 对 所 有 结 点 训 EYv，d， 一 wj、， 电 以 有 了 “= WW， 


算法 的 核心 是 下 面 的 过 程 ， 该 过 程 对 于 给 定 矩 降 D”- 0 和 W 返回 矩阵 加， 即 它 把 筷 


今 计算 出 的 最 短路 径 延伸 一 条 边 。 
EXTEND-SHEORTEST 一 PPATEISID,W) 
1 nrows[D] 


2 设 D=(dj 是 一 个 nxa 上 矩阵 
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3 foris lto 

| do forijn-lton - 

有 型 5 di oo 

看 of 攻 e-1 tt 瑞 

有 性 十 后 maintdudba+w) 


沪 过 程 计算 出 矩阵 D' = (d') 作为 返回 值 ， 对 所 有 ii 和 j， 用 了 代表 D” "，D/ 代 
表 卫 巴 计算 (26.2) 的 等 式 (之 所 以 不 用 上 标 形式 写 出 是 为 了 使 输入 矩阵 和 输 册 矩阵 独立 


于 四， 由 于 算法 中 存在 三 个 慌 套 的 for 循环 ， 所 以 它 的 运行 时 间 为 Btn ),。 


我 们 现在 讨论 算法 和 矩阵 乘法 运算 的 关系 。 假 定 希 望 计算 两 个 n xna 和 矩阵 A 和 了 的 答 


阵 积 C=A.  B， 对 jj = 1.2…mn， 计 算 : 
ci 一 Zu 
汪 间 允 GC 3 中 的 等 作 细 下 赤 抽 后 


(和 一 
二 ) 


WwW 一 bb 
烛 “个 
mina 一 十 
十 一 


(26.4) 


妈 得 到 (26.4 和 中 的 等 式 。 因 此 ， 如 果 我 们 对 过 程 EXTEND -SHORTEST 一 PATHS 进行 
这 样 的 变换 ， 并 用 0( 表示 + ) 替换 oo{ 表示 min)， 就 得 到 一 个 简洁 明了 的 矩阵 科 法 运算 过 


. 程 ， 其 运行 时 间 为 B(n ). 


MATRIX-MULTIPLY(A,B) 
1 neroOwWg[A] 

2 设 C 为 一 #xE 矩阵 

3 fpriltont 

不 do fofrie-iton 

5 do cr 

析 [or 丰 s 一 to 全 

了 do oj” cytau bu 
3 Teturfn 人 


回 到 每 结 点 癌 的 最 短路 径 问题 ， 我 们 是 通过 把 最 短路 径 逐 边 延 视 而 最 终 计算 出 最 短路 各 
的 权 的 ， 设 A, B 表示 过 程 EXTEND-SHORTEST-PATHS(A， 马 所 返回 的 结果 矩阵 ， 我 们 


站 n1 的 
“W 


= W 
pa pew = 更" 
D -=DOW = WW; 


一 380 一 


让 王 Do- = 机 " 
如 我 们 在 前 面 所 论证 的 那样 ， 和 矩阵 De -0 = W?-: 包含 最 短路 径 的 权 。 下 面 的 过 程 计 


算出 该 序列 ， 且 其 运行 时 间 为 Ban )， 
图 26.1 说 明了 一 个 图 和 由 过 程 SLOW 一 ALEL 一 PAITIRS 一 SHORTEST 一 PATHS 讨 算 


出 的 矩阵 D”. 





人 2 

3 (和 -41 7 了 

DDN=io 4 0 1 

2 -1] -5 0 -2 
Se oo 和 站 

0 3 -3 2 -4 0 1 -3 2 -4 

3 0 -4 1 -1 3 0 -4 1 ~ 
PD9D=|7 4 05 1 DO=|7 4 05 3 
12 -1 -5 0 -2 2 -~1 -5 0 -2 

8 和 16 0 aa ss 16 0 


图 26.1 一 有 向 儿 和 由 过 程 SLOW-ALL_PAIRS_SHORTEST_PATHS 计算 出 的 一 系列 矩阵 D 全 


读者 可 自行 验证 D% = D” 。W 等 于 D”， 因 此 对 所 有 m > 4， 有 D ” = 了 


SLOW 一 ALL -PPAIRS 一 SHORTEST 一 PATHS(W)》 


当 
站 
日 
电 


formet2 tm 一 1 
do Do 一 EXTEND 一 SHORTEST -~ _PATHSDe-a 
retorn D?2- 9 
算法 运行 时 间 的 改进 
不 过 ， 我 们 的 目标 并 不 是 计算 出 全 部 的 D” 失 阵 : 我 们 所 感 兴趣 的 仅仅 是 抢 
阵 D" "。 回 想 在 不 存在 负 权 回路 的 条 件 下 ，(26.3) 的 等 式 说明 对 所 有 整数 mm 关 m 一 1 
有 了 DSS =D2 ， 通过 计算 下 列 矩 阵 序列 我 们 可 以 仅 计算 Tlg(n 一 I 个 矩阵 积 就 得 
出 ec 


nm 


一 38] 一 


D” = 玛 一双 ” 风 
D” = 有 = 机 

Tgla 一 菇 1 ra 一 扩 1 Tie 下 1-1 Te-it1-1 
站 》 -~ R 一 三 : 。 三 


因为 2 nen- 1 >mn 一 1， 所 以 最 后 结果 D2“” ”) 就 等 于 Do- ， 
下 面 的 过 程 运用 “反复 平方 * 技术 计算 上 述 矩 阵 序列 : 


FEASTER 一 ALL 一 PAIRS 一 SHORTEST 一 PATHSIWY》 
1 了 二 Towg 引 Wi 


mtE+ 1 
while 日 一 1 > 专 
do D ”EXTEND -SHORTEST -PATHS(D 和 .De ) 
Im +- 2 


yetarmn 卫 光 


9 


在 第 4 一 6 行 while 鼻 环 的 每 次 入 代 中 ， 从 症 = 1 开始 ， 计 算 了 后 =(D 史 )， 在 每 次 
迭代 的 最 后 ， 把 下 的 值 乘 以 2。 最 后 一 次 选 代 实际 通过 对 mn -1<s2m<2n 一 2 计算 
”出 D” ,从 而 得 到 D” ”。 根 据 (26.3) 中 的 等 式 ， 有 D ”= D" … ”。 下 一 次 执行 第 4 行 申 
的 测试 语句 时 ， 由 于 im 已 被 滋 2， 所 以 有 mn - 1 所 下 ， 测 试 失 败 ， 因 此 过 程 返 回 它 计算 出 的 
最 后 一 个 阜 阵 。 

四 为 要 获得 【lg (n-D ] 个 审 阵 积 中 的 每 一 个 积 都 需要 提 (n) 的 时 间 ， 所 以 FASTER-- 
AILL 一 PAIRS 一 SHORTEST-PATHS 的 全 部 运行 时 间 为 B(nolg nm。 注意 算法 中 的 代码 是 紧 
次 的 ， 其 中 不 包含 复杂 的 数据 结构 ， 因 此 隐 含 于 @- 记 号 中 的 常数 是 很 小 的 。 


26.2 ”Floyd-Warshall 算法 


在 本 节 中 ， 我 们 将 要 用 另 一 种 动态 程序 设计 方案 来 解决 关于 有 向 图 台 ={V,E) 每 对 结 点 
间 的 最 短路 径 问题 。 所 产生 的 算法 称 为 Floyd-Warshali 算法 ， 其 运行 时 间 为 @(V]J。 和 前 
面 一 样 ， 可 以 存在 权 为 负 的 边 ， 但 我 们 假定 不 存在 权 为 负 的 回路 。 如 第 26.1 节 ， 我 们 将 按 
照 动 态 程序 设计 进程 来 开发 相应 的 算法 。 在 学 习 完 产生 的 算法 后 ， 我 们 将 提供 一 类 做 方法 来 . 
找 出 存 问 图 的 传递 所 包 。 


最 短路 径 的 结构 


在 Floyd-Warshall 算法 中 ， 我 们 利用 了 最 短路 径 结 构 中 的 另外 一 个 特征 ， 它 和 我 们 在 
基于 矩阵 煞 法 运算 基础 上 的 每 对 结 点 算法 中 所 利用 的 结构 特征 是 不 同 的 。 算 法 考察 的 是 一 条 
最 短路 径 上 的 “中 间 " 结 点 ， 其 中 某 条 简单 路 径 p= <Yyo > 的 中 间 结 点 是 P 中 除 v 和 
v 以 外 的 任何 结 点 ， 即 任何 属于 集合 {v2va wj 的 结 点 。 


一 让 2 一 


Floyd~Warshall 算法 主要 基于 下 列 观察 设 避 的 结 点 为 Y= {12,…, 中 ， 并 对 某 个 攻 考 
察 其 结 点 子 集 {1.2,…j。 对 任意 一 对 缚 点 刘 EV， 考 察 从 i 到 j 且 其 中 间 结 点 尼 属 于 集合 
2 … 丘 的 所 有 路 径 ， 设 P 是 其 中 的 一 条 最 小 权 路 径 (因为 我 们 假定 对 中 不 包含 负 权 同 路 ," 
所 以 p 是 简单 路 径 )。 Floyd-Warshall 算法 利用 了 路 径 p 与 从 ji 到 j 间 的 最 短路 径 ( 所 有 中 间 
结 点 涌 属 于 集合 {1, 2. …,k- 二 之 癌 的 联系 。 这 一 联系 取决 于 是 否 是 路 径 p 的 一 个 中 间 结 
点 。 
- 如 果 下 不 是 路 径 p 的 中 得 结 点 ， 则 B 的 所 有 中 间 结 点 皆 在 集合 11.2,… 攻 -1 二 中， 因此 
从 结 点 i 到 结 点 j 且 满 足 所 有 中 间 销 点 凡 属于 集合 绅 ,2,… 汪 - 匡 的 一 条 最 短路 径 也 同样 是 从 ; 
到 j 县 满足 所 有 中 间 结 点 篆 属 于 集合 tl2,… 汪 } 的 一 条 最 短路 径 。 
”如果 是 路 径 p 的 中 间 结 点 ， 由 如 图 26.2 所 示 ， 我 们 把 P 分 解 为 1 入 wx ~ j。 由 
引 理 25.1，p, 是 从 1 到 k 的 一 条 最 短路 径 ， 旦 其 所 有 中 间 结 点 均 属 于 集合 {1.2…4 妈 。 事 实 


上 ， 结 点 上 不 是 路 径 P 的 中 间 结 点 ， 所 以 P， 是 从 i 到 & 的 一 条 拓 路 径 ， 且 满足 所 有 中 间 结 
点 均 属 于 集合 {1.2… 主 一 卫 : 类 似 地 ，pP, 是 从 上 到 j 的 一 条 最 短路 径 ， 且 其 所 有 中 间 结 点 
名 属于 集合 {12.… 汪 一直。 


站 


围 26.2 路 径 P 基 从 结 点 1 到 j 的 一 条 县 短路 答 


解决 每 对 结 点 间 是 短路 径 问 题 的 一 种 递归 方案 
基于 上 述 观 察 ， 与 第 26.1 节 不 同 。 我 们 将 给 出 定义 最 短路 径 估计 的 一 个 递归 公式 。 
设 dm 为 从 结 点 ;i 到 绪 皮 j 目 满足 所 有 中 间 结 点 均 属于 集合 {1.2.… 二 } 的 一 条 最 短路 径 的 
权 。 当 《= 0 时 ， 从 结 点 i 到 结 点 j 的 路 径 中 根本 不 存在 中 间 结 点 ， 因 此 它 至 多 包含 一 条 
边 ， 则 有 di， = wj。 递归 定义 由 下 式 给 出 : 
若 k=0 


9 
山 -sraar- "+de 2 若 K>1 (26.5) 


二 让 





失 阵 D = 《d% ) 给 出 了 最 后 解 do = 5G6j)， 对 所 有 这 
洁 点 缘 属 于 集合 112…。 

自 底 向 上 计算 最 短路 径 的 权 

基于 (26.5) 给 出 的 递归 定义 ， 我 们 可 以 运用 下 面 的 自 底 向 上 过 程 按 k 值 的 递增 闫 序 计 算 
出 dy 。 过程 的 输入 是 (26.1) 中 所 定义 n xm 和 矩阵 W。 其 返回 值 是 关于 最 氮 路 径 的 权 的 算 
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Fioyd 


8 
和 


辣 
oo 
站 昌 ) = Ge 
了 
oo 
0 
的 
加 
.了 
oo 
0 
ooc 
DB = 】 oo 
oo 
Di -~ 


4 


| 
1 
| 
| 
| 


和 


是 8 


| 
员 一 种 扬 愉 


8 wocgw 


8 wo=8w 


8 8 


8 vcg 
cg 一 8 


小 已 一 8 . 


轨 号 册 一 和 局 mw 一 上 人 己 wh 一 和 


如 一 


吾 


生生 关 王 二 


到 导 
NIL 


NIL 
1 
IC 


本 1L 


图 26.3 ”对 图 26.1 所 示 的 图 用 Floyd-Warshall 算法 计算 出 的 矩阵 序列 m 和 mr 


n+-TOows[W] 
D”.- 风 
fof 长 呈 1 to 记 


一 如 arshailfW') 


do fof it to 蔚 
do for ] 上 一 1 to 二 


6 da minfds yds +de . 
7 Teturn 日 中 


图 26.3 说 明 一 有 向 图 以 及 对 该 图 用 Fioyd - Warshal 算 法 计算 旨 的 矩阵 D“. 

Floyd--Warshal 算法 的 运行 时 间 是 由 第 3-6 行 的 三 重典 套 for 循环 所 决定 的 。 每 次 执 
行 第 6 行 的 运行 时 间 为 D(D)。 因 此 算法 的 运行 时 间 为 @no7)。 正 如 第 26.1 节 中 最 后 的 算法 
一 样 ， 其 代码 是 蜂 资 的 且 不 包 售 复 杂 的 数据 结构 ， 因 此 咎 含 于 怠 -记号 中 的 常数 是 很 小 的 。 
所 以 说 ， 即 便 对 中 等 规模 的 输入 图 来 说 ，Ftoyd--Warshall 算法 仍然 是 相当 实用 的 。 


建立 最 短路 征 


在 Floyd-Warshall 算法 中 存在 大 量 不 则 的 方法 来 建立 最 短路 径 ， 一 种 途径 就 是 计算 有 
关 最 短 通 路 的 权 的 矩阵 D， 然 后 根据 矩阵 D 构造 其 先辈 矩阵 r。 实 现 这 一 方法 所 需要 的 运 
行 时 间 为 On3)( 见 练习 26.1-53)。 在 获得 先 奉 矩 阵 zx 后 ， 就 可 以 使 用 过 程 
PRINT-ALL-PAIRS-SHORTEST 一 PATH 来 打印 求 出 的 最 短路 径 上 的 结 点 。 
我 们 可 以 像 Floyd - Warshal 算法 计算 矩阵 D” 那样 对 先辈 矩阵 进行 “联机 ” 计 
算 。 具 体 来 说 ， 我 们 计算 一 矩阵 序列 xf" “， 其 中 于 = z"， 并 且 我 们 定义 zy 为 
从 i 出 发 且 满 足 所 有 中 间 结 点 均 属 于 集合 {1,.2… 上 } 的 最 短路 径 上 结 点 j 的 先辈 。 
我 们 可 以 给 出 定义 zy 的 递归 公式 ， 当 k=0 时 ， 从 i 到 于 的 最 短路 径 根本 不 存在 中 间 
结 点 。 因 此 ， 
一 人 如 条 一 十 Wi 一 加 
i 如 果 i 尖 j 且 wi < oo 
对 于 kz 1， 如 果 我 们 取 路 径 i kk j， 则 我 们 所 选择 的 j 的 先辈 与 我 们 在 从 k 出 发 且 治 
足 所 有 中 间 结 点 均 属 于 集合 {1,.2… 汪 一 1 的 最 短路 径 上 所 选择 的 j 的 先 华 相同 。 否 则 ， 我 
们 所 选择 的 j 的 先 非 就 与 我 们 在 从 i 出 发 且 满 足 所 有 中 问 结 点 询 属 于 集合 和,.2… 业 一 1} 的 最 
短路 径 上 所 选择 的 j 的 先辈 相同 。 对 > 1， 有 有 


伺 一 1 


作 一 衣 一 全 
虽 - 如 果 d， de 0 


(26.6)} 


耻 
如 果 d， “> di 


我 们 把 za 矩阵 的 计算 与 Floyd-Warshall 过 程 的 合并 工作 留 作 练习 (练习 26.2-3)。 图 
2%.3 说 明了 由 此 产生 的 算法 对 图 26.1 所 示 的 图 计算 所 得 的 zx 由 矩阵 序列 。 练 习 中 还 提出 了 更 
:困难 一 些 的 任务 ， 即 要 求证 明 先 辈子 图 G.i 是 以 i 为 根 的 一 棵 最 短路 径 树 。 另 外 还 有 -一 种 重 

， 建 最 短路 径 的 方法 留 作 练 习 ( 见 练习 26.2-- 句 . 


上。 有 疝 图 的 伟 带 闭 包 
已 知 一 有 向 图 G=(V,B， 其 结 点 集合 为 V= {1.2,…sa}， 我 们 也 许 希 望 发 现 对 所 有 结 点 
对 刘 CY， 图 G 中 是 否 存在 一 条 从 i 到 j 的 路 和 为 解 次 这 个 问题 ,定义 G 的 传闻 闭 包 为 图 

G- =(V,E"), 其 中 


-1 6 


385 一 


BE ={Gj): 台中 从 结 点 1 到 结 点 j 存在 一 条 有 通路 } 
在 人 7) 的 运行 时 间 内 计算 出 一 图 的 传递 闭 包 的 一 种 方法 是 对 五 中 每 边 赋 权 为 1， 然后 
对 该 图 送行 Floyd--Warshall 算法 。 如 果 从 结 点 到 结 点 j 存在 一 条 适 路 ， 有 di<n。 否 则 ， 
有 出 =oc。 
和 入 外 迁 有 一 各 类似 的 方法 可 以 在 @tn ) 的 运行 时 间 内 计算 出 台 的 传递 闭 包 ， 这 种 方法 
在 实际 旗 用 中 可 以 节省 时 间 和 空 人 外。 该 方法 要 求 把 Floyd 一 克 arshall 算法 中 的 算术 运算 操 
作 min 和 二 用 相 庶 的 逻辑 运算 YV 和 人 来 代替 。 对 ijk = 1,2…n， 如 果 图 G 中 从 结 点 j 


到 结 点 j 存在 一 条 通路 且 其 所 有 中 间 结 点 均 局 于 集合 {1.2…}， 则 定义 t 为 1， 井 册 


j 
为 tW 为 0。 我 们 把 边 (ij) 加 入 五” 中 当 且 仅 当 ty = 1， 通 过 这 种 方式 我 们 来 构造 传递 闭 
包 G ”= (VE ”)。 与 (26.5) 中 的 递归 式 相 类 似 ，tyf， 的 递归 定义 为 
ta - fi 者 zj 县 (jp)#E 
1 若 i = j 或 (ij)EE 
节 对 kk 之 1 
t 人 一 人 V (At ” 】 (26.8) 


正如 Floyd -- Warshall 算法 那样 ， 我 们 按 k 的 递增 顺序 来 计算 矩阵 T ”= (ti ) 


TRANSIIVE 一 人 LODSURELG) 
1 an 一 YIGI]| 
2 for it tomn 
3 do ior j 和 1ton 
do 计 i=j or ()sE[G] 


4 

5 

6 else 外 二 0 
7 forkti toa 

各 do for ie tomn 
$ do for jd to 了 


国 全 < 人 -DA 让 一 站 
10 do ti 全 名 vt 人 tu 】 


11 retutrn 工作 


圈 26.4 说 明了 过 程 TRANSITIVE-CLOSURE 对 样 图 进行 计算 所 得 的 矩阵 Too， 和 和 
Floyd-Warshal 算法 一 样 ， 过 程 TRANSTIVE-CLOSURE 的 运行 时 间 也 是 @@(n3}。 但 是 
在 某 些 计算 机 上 ， 位 肥 辑 操作 的 执行 速 席 快 于 对 整数 字 长 的 数据 的 算术 运 竺 操作 。 再 者 ， 因 
为 直接 的 传递 闭 包 计算 中 仅 使 用 布尔 值 而 不 是 整 型 数 ， 其 空间 要 求 也 比 Floyd-Warshall 算 
法 小 ， 具 体 小 多 少 则 与 计算 机 的 字 长 有 关 。 

在 第 26.4 节 中 ， 我 们 将 会 看 到 过 程 Floyd-Warshall 算法 与 .TRANSITIVE-- 
CLOSURE 的 一 致 并 不 仅仅 是 巧合 。 这 两 种 算法 都 是 基于 一 种 称 为 " 闭 尘 环 "的 代数 结构 之 
上 的 ， 
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阴 26.4 一 有 向 图 和 用 传递 闭 包 算法 计算 出 的 矩阵 中 


26.3 ”关于 稀 术 图 的 Johnson 算法 


| 


Johnson 算法 可 在 D(V2ig V+VE) 时 间 内 求 出 每 对 结 点 间 的 最 短路 径 ; 因此 , 对 于 稀 梳 图 
来 说 ， 该 算法 在 渐 近 意义 上 优 于 和 抢 阵 的 反复 平方 法 或 Floyd-warshall 算法 。 算 法 执行 后 要 
么 返回 一 个 关于 每 对 结 点 间 最 短路 径 的 权 揭 矩阵 。 了 要么 报告 输 人 赂 中 存在 一 负 权 回 路 ， 
Johnson 算法 把 第 二 十 五 章 中 描述 的 Dijkstra 算法 和 Bellman-Ford 算法 均 作 为 其 子 例 程 。 

Johnson 算法 运用 了 重 赋 权 技术 ， 其 执行 方式 如 下 。 如 果 图 G=(V,E) 中 所 有 按 的 权 均 
为 非 负 ， 则 我 们 把 每 个 结 点 依次 作为 源 结 点 运行 Dijkstra 算法 就 可 以 找 出 每 对 结 点 间 药 最 
短路 径 ; 若 用 Fibonacci 堆 来 实现 优先 队列 ， 则 该 算法 的 运行 时 间 为 O(V2ig V+VE)。 如 果 
SG 含有 负 权 边 ， 我 们 仅仅 是 采用 同 翌 的 方法 对 一 个 新 的 边 的 非 负 权 集合 进行 计算 ， 这 一 新 
的 集合 中 边 的 权 方 必须 满足 两 个 重要 性 质 。 

L. 对 所 有 结 点 对 uvC V， 使 用 加 权 函 数 w 的 从 到 v 的 一 条 最 短路 径 也 同样 是 使 用 加 
权 函 数 交 的 从 必 到 v 的 一 条 最 短 栈 径 。 
2. 对 所 有 的 边 (uv)， 新 的 权 凶 (ay) 为 非 负 。 
我 们 过 一 会 疙 就 会 看 到 ， 为 确立 新 的 加 入 函数 w 而 对 G 进行 的 预 处 理 可 在 O(VE) 时 间 
内 究 成. 
遵 过 重 贱 权 保持 最 短路 径 
如 下 面 引 理 所 述 ， 对 边 重 新 赋 权 以 汪 足 上 而 第 一 个 性 质 是 较 容 易 的 ， 我 们 用 5 表示 根据 
加 权 画 数 w 导出 的 景 短路 径 的 权 ， 而 用 3 玫 示 根据 加 权 函 数 广 导出 的 最 短路 径 的 权 。 
引 理 26.1( 重 冉 权 不 会 改变 最 短路 径 ) 已 知 有 向 加 权 图 G= (V,E)， 加 权 函 数 为 w: E-~ 
R， 设 h: V-~R 是 映射 结 点 到 实数 的 任意 函数 。 对 每 条 边 (uv EE， 我 们 定义 
Wuw=wfuv 二 ho 一 hv (26.9) 
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设 p= <vovwe > 是 从 结 点 ve 到 结 点 v 的 一 条 路 径 。 则 w(p) = 5 当 自 
仅 当 W(p) = 哉 v， 

员外 根据 加 权 函 数 W，G 中 存在 一 负 权 回路 当 且 仅 当 根 据 加 权 函 数 人 各 中 存在 一 负 权 
回路 。 

证 明 : 首先 我 们 证 明 . 
BO)=wG)+htvy)-hev,) C6.10) 
我 们 有 


页 ( 乓 一 Za ) 


i-13 jj 


) 一 tv 》 


1 一】 


一 we ， AD) 十 hv， 


一 vc: ov) 十 hv 一 hv ) 
一 WPp)+htv) 一 hv ) 
第 3 个 等 式 是 由 第 2 行 的 套 夺 和 导出 的 。 
现在 我 们 通过 引 人 和 人 矛盾 的 方法 证 明 : 车 wp)= iv， 性 ,)， 则 说 明 合 (站 一 vv， )， 假 定 
使 用 加 权 函 数 合 从 vo 到 YV 存在 一 更 短路 径 P， 则 久 (p]) < 亢 (p)。 
由 等 式 (26.10), 
W(p 了 十 htvo) 一 htv ) 一 太 (PP ) 
所 仙 () 
一 wp) 十 htv。 ) 一 hv )， 
这 说 明 wp])<wp)， 但 这 一 绪论 与 我 们 假设 hp 是 使 用 ww 的 从 u 到 的 最 得 路 径 相 予 
盾 。 关 人 人 们 下 
后 ”我 们 证 明报 据 加 权 孙 数 w,G 中 包含 一 负 权 回路 当 且 仅 当 根据 加 权 函 数 售 ,G 中 包 
二 外 路 考察 任意 回路 c= < vv mVYh 其 中 v = 。 根 据 等 式 (26.10)， 
O 一 w+hv) 一 hv ) 一 一 
一 We) 


“因此 根据 w,c 的 权 为 负 当 且 仅 当 根据 售 ,c 的 权 为 负 . 


通过 重典 术 产 生 非 负 的 权 

我 们 的 下 一 个 目标 是 保证 第 二 条 性 质 成 立 : 我 们 希望 对 所 有 边 (uvweE， 信 (uv) 的 值 非 
负 。 给 定 一 有 回 吉 权 图 台 =(V,E)， 权 郴 数 为 w: 了 一 及 ， 我 们 据 此 构造 一 个 新 图 G 
= (VB?， 其 中 人 = VUHsj( 对 某 个 新 结 点 s#V)jB' = BUGw: veV}。 我 们 扩充 加 权 函 
数 w, 使 得 对 所 有 veV， 有 wswj =0。， 注意 因为 不 存在 进入 结 点 8 的 边 ， 所 以 除了 以 & 作为 
源 结 点 的 路 径 ，G' 中 不 存在 包含 s 的 其 他 最 短路 径 。 再 者 G' 不 包含 负 权 回路 当 且 仅 当 
不 包含 负 权 回路 图 26.5(a) 说 明了 相应 于 图 26.1 折 示 的 图 G 的 避 、 
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现在 假定 如 和 人 都 不 含 负 权 回 路 。 我 们 定义 对 所 有 vEV'，h(w) = 5(s,wj。 由 引 理 25.3 
可 知 ， 对 所 有 边 (uyY)eE'， 我 们 有 hfw < hu) + w(uv)。 因 此 如 果 我 们 根据 等 式 (26.9) 定义 


条 性 质 ， 图 26.5(h) 


四 


wav + hftu) 一 hrv) 关 0， 这 样 就 满足 了 第 


新 权 会 ， 则 我们 有 会 (uv) 


说 明了 对 图 26.5(a) 中 的 图 重 赋 权 所 得 到 的 图 G 


计算 每 对 结 点 间 最 短 耻 径 的 Johnson 算法 在 图 26.1 所 








图 上 的 运行 过 程 


归 


图 26. 和 


计算 每 对 结 点 间 的 最 短路 径 


计算 每 对 结 点 间 最 短路 径 的 Johnson 算法 把 Bellman-Ford 算法 (25.3 节 ) 和 Dijkstra 算 
法 (第 25.2 节 ) 作 为 其 子 例 程 。 它 假定 图 的 边 用 邻接 表 形 式 存储 。 算 法 返回 的 是 通常 的 |V1x 
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fy 十 阵 卫 = (dj， 其 中 由 =5Gj) 或 者 算法 通报 输 人 图 中 存在 一 负 权 回 路 。 届 为 使 D 抢 阵 中 
的 元 素 下 标 有 意义 ， 我 们 假定 把 结 点 从 1 到 [V| 进 行 编号 。} 
JOHNSONIG) 
1 计算 后 '， 其 中 V[IG]= YIG]UNsl 
E[GqJ= BIGIU{fGs vevlG 
aa 下 Beiltman 一 ForndtGrw: 2) 一 瑟 LSE 
3 then Print “ 输 大 图 包 售 一 负 权 回 踏 ” 
二 else for 每 个 缚 点 vEWV[IGI] 
5. do 置 h(v) 为 Bellman 一 Ford 算 法 计 和 外 出 的 5(s, 办 的 值 
看 fer 每 条 边 (uwjEE[G] ， 
了 旭 O 区 fuVY 二 ww 十 ha 一 hfv) 
8. for 每 个 缩 点 uEV[G] 
9， do 对 所 有 veVfG], 运 行 DUBKSTRALG, 训 以 计算 出 友 0av) 
10- for 每 个 早点 YEYV[G] 
了 1， “ do du 二 六 nr) 二 Th 一 hu 


这 一 代码 实现 了 我 们 前 面 说 明 的 操作 。 第 1 行 产生 G*。 第 2 行 对 加权 函数 为 w 的 图 G/ 
运行 Bellman-Ford 算法 。 如 果 G' 包 含 负 权 回 路 ， 财 G 也 必 包 含 负 权 回路 ， 第 3 行将 报告 
这 一 问题 。 第 4-11 行 假定 G' 不 包 售 负 权 回路 ， 第 4 行 对 所 有 vt V'， 把 h(Y) 置 为 下 
Bellman~Ford 算法 计算 出 的 最 短路 径 的 权 。 第 6-7 行 计算 新 的 权 伪 。 对 每 对 结 点 mwvE V， 
第 8-1!1 行 中 的 for 循环 中 ， 把 V 中 的 每 个 结 点 逐次 作为 源 结 点 调用 Dijkstra 算法 ， 用 这 种 
算法 计算 出 最 短路 径 的 权 廊 uv)。 第 11 行 把 用 等 式 (26.19) 计 算出 的 最 短路 径 的 权 5(uv) 存 人 
相应 的 矩阵 元 素 duv 中 。 最 后 第 12 行 返回 计算 好 的 矩阵 D。 图 26.5 说 明了 Johnson 算法 
的 执行 流程 。 

很 容易 看 出 , 如 果 采 用 Fibonacci 堆 实 璃 Diikstra 算法 中 的 优先 队列 ， Johnson 算法 的 运 
行 时 间 就 为 DIV4g V+VE)。 如 果 用 更 简单 的 二 叉 维 来 实现 , 则 其 运行 时 间 为 O(VE lg V), 对 
于 稀 朴 图 来 说 , 这 种 实现 从 新 近 意 义 上 来 说 其 速度 仍然 费 比 Floyd-Warshall 算法 快 。 


.* 26.4 解决 有 向 图 中 路 径 问题 的 一 般 性 框架 


在 本 节 中 我 们 要 讨论 称 为 “ 闭 半 环 "的 一 种 代数 结构 ， 这 一 结构 构成 了 解决 有 向 图 中 路 径 
问题 的 一 般 性 框架 ， 开 始 我 们 先 定义 闭 半 环 , 讨论 它 与 有 向 图 演算 之 间 的 关系 。 然 后 我 们 给 
出 一 些 闭 半 环 的 例子 和 一 个 计算 每 对 结 点 间 路 径 信息 的 “一 般 性 "算法 ， 第 26.2 节 讨 论 的 
Floyd 一 warshall 算法 和 传递 闭 包 算法 都 是 这 一 一 般 性 算法 的 例 示 。 


闭 半 环 的 定 蚁 


闭 半 环 是 一 个 系统 (〈S. 申 ,人 ,0.1)， 其 中 $S 为 一 元 素 集合 . 中 ( 求 和 运算 符 ) 和 轩 〈 扩 充 
运算 符 ) 为 定义 在 S 上 的 二 进 制 运算 ，0 和 1 为 $ 中 的 元 素 ， 该 系统 满足 下 列 八 条 人 性质: 
1， 从 ,中 ,0) 是 一 个 类 群 
- 由 运算 在 S 上 是 封闭 的 : 对 所 有 a， b， 《Sa 由 btS 
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- 外 满足 结合 律 : 对 所 有 abjcE Sa 申 (bb 申 中 = (a 申 中 由 < 

. 0 是 由 运算 一 个 单位 元 : 对 所 有 aESa 中 0=0 中 a=a 

同样 ，(S.G@),TD) 是 一 个 类 群 

2. 0 是 一 个 零 元 素 : 对 所 有 akEgSa0=0Oea=0 

3. 由 运算 满足 变换 律 : 对 所 有 abkES，a 电 b=b 中 a 
4. 由 运算 具 有 和 瑚 等 性 : 对 所 有 ak&E S，a 中 3=a 

5. 多 运 算 对 由 运算 满足 分 配 律 : 对 所 有 abct Sa 全 cj 一 .(afeibj 中 (aec) 
fb 中 cj ia 《ba 中 【cea 
6. 如 果 aazaa… 是 S3 中 元 素 组 成 的 一 可 数 序列 ， 则 ai 中 a 中 a; 申 … 有 定义 且 属 于 S。 
7. 结 合 律 ， 交 换 律 和 备 等 性 局 样 适用 于 无 穷 序列 的 四 运算 。 (因此 ， 任 何 无 穷 序列 的 和 
都 可 以 改写 为 另 一 个 无 穷 序 列 和 ， 其 中 的 每 个 项 仅 出 现 一 次 且 求 和 的 顺序 是 任意 的 。) 
8. 运 算 对 无 穷 序 列 和 满足 分 配 律 ; 
aG@ (b 由 b 中 b 中 ) 四 
一 (a@b) 四 (a@bj 中 (a@bj) 申 …(a 中 mm 中 mm 申 …)Gb 
= (aiG@hb) 由 (axeb) 申 (ab) 中 


有 疝 图 中 路 径 的 计算 


虽然 闭 半 环 的 性 质 比较 抽象 ， 但 它们 可 以 与 有 向 图 中 路 径 的 计算 相 联系 。 假设 给 定 一 有 
向 图 台 = 〈V,E) 和 一 标示 范 数 4: VxV~S， 它 将 所 有 有 序 结 点 对 肌 射 到 某 陪 域 $ 中 。 边 
(uv 《E 的 标示 用 Xuv) 表示 。 因 为 4 定义 于 VxY 之 上 上 ， 所 以 若 《uv) 不 是 所 中 的 边 ， 
则 标示 iuv) 通常 作为 0 《我 们 过 会 儿 将 会 看 到 其 头 因 ) 。 

我 们 用 满足 结合 律 的 扩充 算 符 @@ 把 标示 概念 扩展 到 路 径 。 路 径 p= <vuy2… > 的 标 
示 为 : 

hp)] =Aviva) 全 MLvoy3) 二 MEV TDV) 
四 运算 的 单位 元 [可 用 作 空 路 径 的 标示 。 

作为 闭 半 环 应 用 的 一 个 实例 ， 我 们 将 运用 边 的 权 非 负 的 最 短路 径 来 加 以 说 明 。 陪 域 8 
为 及 > ec， 其 中 只” 为 非 负 实数 的 集合 ， 并 且 对 所 有 训 EV， 有 和 入 =wi。 扩充 算 符 
-他 相应 于 算术 运算 符 +， 因 此 路 径 p= Cawe ”wk 的 标示 为 
Hp) =Mv vv iv 四 mv YY) 

一 W 十 We 二 + 且 


= wp) 
他 运算 的 单位 元 1 的 作用 被 + 运算 的 单位 元 0 所 代替 ， 这 并 不 令 人 感到 惊奇 。 我 们 用 se 表 
示 空 路 径 ， 它 的 标示 为 Me) =w(e) =0=I 
因为 扩充 算 符 他 满足 结合 律 ， 所 以 可 用 通常 的 方式 定义 两 条 路 径 的 连接 的 标示 ， 已 知足 
径 Di = <Yyvow> 和 有 =< 天 ww 人 0>， 它 们 的 连接 为 : 
Pi "bb < 
且 其 连接 的 标示 为 : 
MPp 。p2) 一 MvivJeMv TV3J 人 Mtv 1， YI 


了 


一 391 一 


Mrv Give )@-G@hv，iv) 
一 vv TV] 
(vv Je YE JAVA 
一 APKeadp)) 
求 和 算 符 中 既 满 足 交 换 律 又 讲 足 结合 律 ， 它 用 来 对 路 径 标 示 求 和 。 就 是 说 ， 值 MP) 
申 Mp2) 给 出 路 径 pl 和 py 的 标示 的 和 ， 其 语义 对 具体 的 运用 来 说 是 明确 的 . 
我 们 的 虽 标 是 对 所 有 结 点 对 到 EY， 求 得 从 1 到 j 的 所 有 路 径 标示 揭 和 : 
1 = 由 jp) (26.1]) 


要 求 外 满足 交换 律 和 结合 律 是 因为 对 路 径 求 和 的 顺序 应 无 关 紧 要 。 我 们 用 零 元 素 0 作为 
不 是 贺 中 的 边 的 有 序 结 点 对 (av) 的 标示 ， 任 何 包含 不 存在 的 边 的 路 径 的 标示 为 5.。 

对 于 最 短路 径 ， 我 们 用 min 代替 求 和 算 符 四 。min 运算 的 单位 元 是 co， 且 ce 确实 为 + 运 
算 的 零 元 素 : af+ec=ccta 一 cc， 对 所 有 afC R> 人 ee. 全 省 边 的 权 为 ce， 并 且 姐 果 一 条 路 
径 中 的 任何 边 其 权 为 co， 则 该 路 径 的 权 也 是 ce。 

我 们 希望 求 和 算 符 @ 具有 圭 等 性 ， 因 为 从 等 式 (26.11) 可 以 看 出 , 电 应 该 对 路 径 集 合 的 
标示 进行 求 和 。 如 果 P 是 一 路 径 ， 则 {pjHP} = 印 } 如 果 我 们 对 路 径 p 与 其 自身 求 和 ， 则 得 
出 的 标示 也 应 是 p 的 标示 : AMp) 四 jp) =Mp)。 

因为 我 们 考虑 到 一 条 路 径 可 能 不 是 简单 路 径 ， 所 以 一 个 图 中 可 能 有 无 数 条 路 径 《每 条 路 
径 ， 不 论 其 是 否 是 简单 路 径 ， 均 包含 有 限 条 边 ) ,因此 算 符 钞 应 该 可 应 用 于 有 无 数 个 路 径 标 
示 的 情形 。 亦 即 如 果 ajaxay… 是 陪 域 $ 中 的 一 可 数 的 元 素 序列 、 则 算式 aa 四 a) 中 am 由 … 也 
有 定义 且 属 于 陪 域 $S。 以 何 种 顺序 对 路 径 的 标示 求 和 是 无 关 紧 要 的 ， 因 此 对 无 限 序列 求 和 应 
满足 交换 律 和 结合 律 。 此 外 ， 如 果 我 们 对 同一 个 路 径 标示 进行 无 限 次 求 和 运算 ， 我 们 得 到 的 
结果 应 为 a， 因 此 对 无 穷 序列 求 和 还 应 满足 竺 等 性 。 

回头 来 看 看 最 短路 径 的 例子 。 现 在 提 一 个 问题 ， 就 是 min 运算 是 否 可 以 应 用 于 域 R2a 


Ulce} 中 值 的 无 穿 序列 ?例如 ，min，,{17 寻 的 值 是 否 有 定义 ? 如 果 我 们 认为 min 算 符 实 际 
返回 的 是 其 自 变 量 的 最 大 干 限 ， 则 min。_ ,{17k]} 的 值 有 定义 ， 且 min， ,fl 二 =0. 


kE 一 | 
为 计算 出 发 散 路 径 的 标示 ， 我 们 要 求 扩充 算 符 四 对 求 和 算 符 由 满足 分 配 律 ， 如 图 266 
所 示 ， 假 定 有 路 径 u 一 aa vv axv wa y。 根 据 分 配 律 ， 我 们 可 以 通过 计算 (Ap)) 加 jp 访 
中 pp) 人 Ap 访 或 2) 四 (4p2) 中 1 六 来 对 路 径 bp。p; 和 pi。 ps 的 标示 求 和 。 





图 26.6” 因 对 @@ 运用 分 配 律 
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人 有 


园 26.7 二 对 由 的 无 限 和 运用 分 配 律 (因为 存在 回路 总 所 以 从 夭 点 v 到 结 点 天 存 在 无 数 条 路 径 ) 


因为 在 一 个 图 中 可 能 有 无 数 条 路 径 ， 全 不 论 对 有 限 序列 还 是 对 无 限 序 列 的 求 和 运算 都 旋 
满足 分 配 律 。 例 如 在 图 26.7 中 包含 有 路 径 urELa v，v 一 am x， 旺 外 还 包含 回路 vsv。 我 们 必 
须 能 对 路 径 bl ps，pioc pb，plec。e。p… 进 行 求 和 运算 。 而 他 对 无 限 序列 的 求 和 运算 
满足 分 配 律 使 得 我 们 有 : 

CpG 四 00pDGMO MP CUp) 人 HG GO GAOP 坟 中 

一 pp 中 (cp 由 (ccleapD 中 …) 
一 fb 全 (1 中 c 申 (ceic ) 由 【cecec 由 …) 全 1(p)) 

我 们 用 一 种 特别 的 记 法 来 表示 可 以 经 过 其 任意 次 数 的 回路 的 标示 。 假 定 有 一 回路 c， 其 
标示 为 ce) =a。 我 们 可 以 穿 过 c 堆 人 次， 其 标示 6) =1， 一 次 则 其 标示 为 Mec) =a， 两 次 
则 其 标示 为 Mec) 全 Ne =aaia 等 等 。 经 过 回 政 c 无 穷 次 时 对 各 次 标示 求 和 所 得 的 标示 是 a 
的 闭 包 ， 定 义 为 : 

a = 下 aa 四 (aeay 四 (aaGial 由 (aGaGaea) 中 … 
因此 在 图 26.7 中 ， 我 们 希望 计算 出 1p)) 人 (CD 人 MP) 。 

在 最 短路 径 的 实例 中 ， 对 任意 非 负 实 数 aER>  j{cec} 


a 一 minfka}l 一 0 
ks 一 小 


这 一 性 质 可 了 以 解释 为 : 由 于 所 有 回路 的 权 为 非 仙 ， 所 以 不 存在 需要 穿越 整个 回路 的 最 短 
路 径 。 


闭 半 环 的 实例 


我 们 上 商 已 看 到 闲 半 环 的 一 个 例子 ， 即 Si = (R>o Jeehmin+,oc,0)， 我 们 用 该 系统 
说 明了 边 的 权 为 非 负 的 最 短路 径 问 题 。( 如 前 所 述 ，min 算 符 实际 得 到 的 是 其 自 变量 的 最 大 
下 上限.》 我 们 也 证 明了 对 所 有 aERzot jicej，a“=0。 

但 是 我 们 说 ， 即 使 存在 负 权 边 ， 只 要 图 中 不 包含 负 权 回 路 ， 用 Floyd-Warshali 算法 同 
样 能 计算 出 最 短路 径 的 权 。 通 过 增加 适当 的 闭 包 算 符 和 把 标示 的 障 域 扩 展 为 RUj{-coe，+eceh 

我 们 可 以 找 出 一 闭 半 环 来 对 负 权 回路 进行 相应 处 理 。 如 果 用 min 代 蔡 中 ， 用 + 代替 @@)， 
读者 可 以 验证 aE R{ j{-ce，+ee} 的 闭 包 为 : 

册 -人 旭 果 a 兰 0 
一 o 如 果 a<n0 

第 二 种 情况 (a<0) 把 下 述 情 形 模型 化 : 即 我 们 可 以 穿 过 负 权 回路 无 数 次 , 使 得 包含 该 
回路 的 枉 何 路 径 的 权 均 为 -ce。 因 此 ， 应 用 于 共有 负 权 值 的 Floyd--Warshall 算法 的 闭 半 环 
为 8 一 【RUfree，+ce)，min，+，+ee， 仆 ( 见 练习 26.4-3) 。 

对 传递 闭 包 ， 我 们 应 用 六 半 环 $S;= 【〔f0,1 直 人 :VD， 其 中 如 果 人) 和 E， 则 1) 
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=j1; 否则 ii =0。 在 此 我 们 有 0* =1* = |。 
关于 有 向 图 标示 的 一 个 动态 程序 设计 算法 
假定 给 定 一 有 向 图 G= 《〈V,E)， 其 标示 画 数 为 4 VxV-S。 其 结 点 按 1 到 的 顺 译 


编号。 对 每 对 结 点 训 &V， 我 们 希望 计算 等 式 〈26.11) 
1 一 由 4p) 
iBj 
该 式 是 使 用 求 和 算 符 昌 对 从 i 到 j 的 所 有 路径 求 和 所 得 的 结果 。 例 如 对 于 最 短路 径 ， 我 
位 希望 计算 出 


1 一 SG) =mintw(p) 
记 -Laj 
存 存 一 种 动态 程序 设计 算法 来 解决 这 一 问题 ， 其 形式 与 Floyd_Warshalt 算法 以 及 传递 
闭 包 算 法 很 相似 。 设 C% 为 从 结 点 i 到 j 的 路 径 的 集合 , 且 路 径 的 所 有 中 间 结 点 均 属于 集合 


2 省。 征文: 


注意 该 定义 与 Joyd ~ Warshall 算法 中 dj ”的 定义 以 及 传递 闭 包 算 法 中 巴 ” 的 定义 相 
似 。 我 们 可 以 递归 定义 Hi 为 


本 et @ 人 (这 】 @lv 】 (26.12) 


计 证 


递归 式 《26.12) 使 人 联想 到 递归 式 〈25.6) 和 (25.8) ， 但 (26.12)》 中 含有 一 附加 因 
子 (!-”) 。 该 因子 表示 对 经 过 结 点 k 且 所 有 其 他 结 点 属于 集合 {1.2,… 业 一 1} 的 所 有 回 


路 求 和 ，。 《 当 我 们 假定 Floyd -- Warshall 算法 中 不 存在 负 权 回路 时 ，( co ) 为 0， 对 


kk 


应 于 空 回路 的 权 TI。 在 传递 闭 包 算法 中 ， 对 从 到 k 的 空 路 径 ， 有 ( 儿 tt ”| -1= 革 因此 


对 这 而 种 算法 来 说 ， 我 们 可 以 忽略 因子 (1& ” ) ， 这 是 因为 它 是 @ 算 符 的 单位 元 。) 该 
递归 定义 的 其 基础 是 : 
四 _ 人 2 如 果 i 关 j 
1 引 1) ”如 疆 =j 
该 式 说 明 单 边 路 径 < j > 的 标示 为 4(ij) 《如果 (ij) 不 是 了 中 的 一 条 边 ， 则 410) 
= 可 。 如 果 又 有 i=j， 则 从 i 到 ji 的 空 路 径 的 标示 为 
该 动态 程序 设计 算法 根据 k 的 递增 顺序 逐个 计算 出 1， 的 值 ,最 后 返回 矩阵 LOn) 
= (9 ). 
CRMPIUTE 一 SUMMRARIESC VD) 
1 Tt 一 | 台 | 
一 -3594 一 


for 1 人 二] to 


之 

3 do for j+- 1 吉 了 

4 do 主 i=ji 

5 then 1 一 T@ if 有 
6 else 1 < 一 4) 
了 人 oOT 攻 ft1L 旋 和 舍 

当 do for 1 二 ] to 晶 

9 dp for jt 1 ton 


10 dd I 人 |- 四 (时 @(C” 】 Ge 】 


上 kk 


Il1 Fetura L 


该 算法 的 运行 时 间 依 赖 寺 @、@ 和 * 执行 所 用 的 时 间 。 如 果 用 TG@，T@ 和 T* 分 
别 代表 这 些 时 间 量 ， 则 COMPUTE - SUMMARIES 的 运行 时 间 为 : @tn (T。 +T。 


+T.)， 如 果 三 种 操作 中 每 种 的 执行 时 间 均 为 O0(10) ， 则 本 算法 运行 时 间 为 Ba ) . 


思 考 题 


26-1 动态 围 的 传递 奢 包 


假定 对 有 向 图 G= 〈V,E)， 当 我 们 播 人 边 到 E 中 时 希望 保持 其 传递 闭 包 的 正确 性 ， 即 
在 插入 每 条 边 后 ， 我 们 希望 对 馆 今 为 止 已 揪 人 边 的 传递 闭 包 进 行 更 新 。 假 设 图 G 开始 时 不 
包含 任何 边 ， 并 且 传 递 闭 包 用 布尔 给 阵 来 表示 。 

a .说 明 当 插入 一 条 新 边 到 G= (VE) 中 时 ， 如 何 能 在 O(V?) 的 运行 时 间 内 对 其 传递 闭 
包 G" = (VE") 进行 更 新 ? | 

b 举 出 一 图 G 和 边 e 的 例子 说 明 当 e 被 插 人 G 中 后 ， 需 要 Q(V2) 的 运行 时 间 以 对 G 
的 传递 闭 包 进行 更 新 

c. 描 述 一 有 效 算法 使 得 在 图 中 插入 一 条 边 时 算法 能 对 图 的 传递 闭 包 进 行 更 新 。 对 任意 一 


个 由 次 揪 人 操作 组 成 的 序列 ， 所 给 出 的 算法 的 运行 时 间 应 为 ”上 = Q(V ”) ， 其 中 是 
当 第 i 条 边 被 插 人 时 更 新 传递 闭 包 所 需 的 时 间 。 证 明 你 的 算法 的 运行 时 间 在 此 时 间 范 围 内 。 


26-2 季 一 稠密 图 中 的 最 短路 径 


在 图 G= (V,E) 中 ， 如 果 对 某 常数 0<E < 和 it， 有 IEI=G@VF)， 则 说 图 台 是 人 -稠密 
的 。 通 过 在 关于 和 -稠密 团 的 最 短路 径 算 法 中 运用 4 叉 堆 【〈 见 问题 7-27， 我 们 能 够 使 算法 
的 运行 时 间 相 当 于 基于 Fibonaceci 堆 的 算法 的 运行 时 间 , 无 需 引信 后 者 所 使 用 的 复杂 数据 结 
构 ， 

a. 在 dd 又 堆 中 ， 过 程 INSERT，EXTRACT_MIN 和 DECREASE-KBEY 都 可 看 作 是 
关于 d 和 元 素数 目 mn 的 函数 ， 从 渐 近 意义 上 来 看 ， 这 几 个 过 程 的 运行 时 间 如 何 表达 ?如 果 选 
择 d= 台 (on，w 为 满足 0D<wsl 的 某 常 数 ， 则 它们 的 运行 时 间 又 如 何 描述 ? 试 把 这 些 运行 时 
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闻 与 在 Fibonacci 堆 上 执行 这 些 操作 的 芷 捧 代价 作 一 比较 ， 

b. 说 明 如 何在 O(E) 的 运行 时 间 内 对 一 不 含 负 权 边 的 有 向 E -稠密 图 G= 〈V,B) 计算 
出 从 某 源 结 点 出 发 的 单 源 最 短路 径 。 (提示 : 把 d 看 作 E 的 苑 数 ) 

c. 说 明 如 何在 O(VEB) 的 运行 时 间 内 对 一 不 含 负 权 边 的 有 向 E -稠密 图 G= 〈V,E) 解决 
其 每 对 结 点 间 的 最 短路 径 问 题 ， 

d. 说 明 如 何在 O(VE) 的 运行 时 间 内 对 一 个 可 能 包含 负 权 边 但 不 包含 负 权 回路 的 有 向 
-稠密 图 解决 其 每 对 结 点 间 的 最 短路 径 问 题 。 


26-3 ”作为 一 个 闭 半 环 的 最 小 生成 树 、 


设 台 = (V,E)》 是 无 向 连通 图 ， 其 加 权 函 数 w: E~ 及 。 其 结 点 集合 为 V={12…n+ 
其 中 nm=iwl， 并 假定 所 有 边 的 权 wj) 都 是 唯一 的 。 设 工 是 G 的 唯一 一 棵 最 小 生成 树 〈 兄 
练习 24.1-6) 。 在 本 问题 中 ， 我 们 将 根据 B.M.Magsgs 和 S.A.Plotkin 的 建议 ， 使 用 一 个 困 半 
环 来 确定 了 。 首 先 对 于 每 对 缚 点 训 & V， 确 定 极 大 极 小 权 (minimax weight) 为 : 


mL 一 min max we) 
] ij BR- 下 的 地 


艺 简 要 证 明 以 下 断言 正确 : SS= 【〈RUL 人 ce，c，min，inax，o2，~ec) 是 一 个 闲 半 

了 环 。 

由 于 S 是 一 个 寺 半 环 ， 所 以 可 以 应 用 过 程 COMPUTE-SUMMARIES 来 确定 图 台 的 
- 极 大 概 小 权 。 设 mm，(g 为 从 结 点 i 到 结 点 j 且 满 足 所 有 中 间 结 点 属于 集合 {1.2,…: 节 的 所 有 
路 径 的 极 大 极 小 权 。 

b. 对 K>0， 写 出 m， 的 递归 定义 式 。 

c. 设 Tu 一 1 6 的) 《 瑟 : wGj) 三 如 证明 To。 中 的 边 形 成 一 柠 台 的 生成 树 。 

d, 证 明 : T,=T。{ 提 示 : 考虑 加 人 过 (jj) 到 工 中 并 在 从 i 到 j 的 另 一 条 路 径 上 去 掉 一 
茶 边 后 的 结果 , 再 考 上 从 工 中 去 掉 边 《jj) 并 用 另 一 条 边 代 赫 它 以 后 的 线 果 。) 


练习 二 十 六 


26.1-1 对 图 26.8 审 的 有 向 加 权 图 运行 SLOW 一 ALL-PAIRS- SHORTEST- PATHS， 说 明 各 循环 . 
中 和 紫 坎 迭代 生成 的 矩阵 。 然 后 再 运行 EASTER- ALL 一 PAIRS- SHORTEST- 了 ATHS， 并 说 明 各 循环 中 
等 次 渤 代 所 生成 的 邱 阵 。 

26.1-2 ”为 什么 我 们 要 求 对 所 有 1 科 j 乏 2， 同一 吕 

26.1-3 在 最 短路 径 算 法 中 使 用 的 矩阵 DO 在 常规 的 矩阵 乘法 运算 中 对 应 于 什么 ? 


站 区 
人 站 有 0 

临 
吾 一 加 00 有 
中 的 名 


26.1-4 ”说明 如 何 用 矩阵 和 向 量 的 积 来 描述 单 源 最 短路 径 问 题 ， 并 描述 如 何 使 对 该 积 的 计算 适合 于 像 
Beltman 一 Ford 这 样 的 算法 ( 见 第 25.3 节 } 
26.1-5” 翁 定 我 们 还 希望 在 本 节 的 算法 中 得 出 最 短路 径 上 的 结 点 。 说 明 如 何在 O(n3) 的 和 运行 时 间 内 从 已 
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完成 的 有 关 攻 短路 径 权 揭 宛 隆 吕 计算 出 先辈 算 阵 #. 


26.1 一 各 ”可 以 用 与 计算 最 短路 径 的 权 相 同 的 时 间 计 算出 最 短路 径 上 的 结 点 。 我 们 定义 ri 为 从 ji 到 j 
的 莫 雪 包含 血 条 按 的 任何 最 小 权 路 径 中 结 点 j 的 先辈 。 妨 改 EXTEND 一 SHORTEST 一 PATHS 和 SLOW 
-ALL 一 PAIRS 一 SHORTEST -- PATHS， 使 得 在 矩阵 D“，D”,…,D” ”的 计算 完成 后 ， 算 法 可 以 计 
算出 抑 隆 IT, 吕 人 了 

26.]-7 如 上 所 述 ，FASTER 一 ALL-PA1RS-SHORTEST-PATHS 要 求 我 们 建立 这 (n-l] 个 和 抢 


阵 ， 其 中 每 个 第 阵 包 含 于 个 元 素 ， 其 占用 的 整个 存储 容量 为 @(n'lg mj， 试 对 过 程 进行 收 改 , 使 其 仅 使 用 两 
个 nxa 此 阵 ， 需 要 的 存储 空间 为 @@(o)。 


26.1--8 赃 属 FASTER-ALL-PAIRS-SHORTEST-PATHS， 使 其 能 检测 出 图 中 是 否 存 在 权 为 负 的 
阿 路 。 


26.1-9” 写 出 一 有 效 算 法 以 求 出 图 中 最 短 的 负 权 回路 的 长 (所 包含 的 边 数 ]，， 





图 26.8 练习 26.1-1，26,.2~1 和 26.3-1 中 用 到 的 有 向 加 权 图 


26.2-1 对 图 站 .8 所 示 的 有 向 加 权 图 运行 Floyd-Warshall 算法 , 并 写 出 外 层 循 环 中 每 次 选 代 所 生成 的 
短 阵 De . 

26.2 一 2 如 上 所 见 ， 由 于 我 们 要 计算 dy ， jj = 1.2,…， 所 以 Floyd 一 Warshall 算法 的 空间 要 求 
为 ketn?)。 证 明 : 仅仅 去 掉 所 有 上 上 标 所 得 的 如 下 过 程 是 正确 的 ， 因 而 其 空间 需要 仅 为 @(n )。 


Floyd 一 WarshalMfw) 
t me-rowslWw] 
2 也 一 凡 
3 forKEtlto 
二 do for 1 坟 1 to 1 
5 do ior 二 1 to 
6 dj 一 minfd di +du) 
.了 ttutmn 防 . 

26.2-3 根据 (26.6) 和 (26.7) 中 揭 等 式 ,修改 过 程 Floyd -- Warshall 以 使 其 包 沼 对 年 阵 六 ”的 计算 。 
”证 明 对 所 有 iceV， 先 辈子 图 加.; 是 以 i 为 根 的 一 棵 最 短路 径 树 .【 提示 : 为 了 证 明 G, 是 无 回路 卫 ， 先 证 
明 : ri = 1 将 会 说 明 dy > dr "+wi。 拓 后 改写 引 理 25.8 的 证 明 。) 

26.2 一 4 很 设 我 们 修改 (26.7) 的 定义 中 等 号 的 位 置 ， 
_ 上 如 果 di <<d +de 
四 ze 如 果 di > de Ta 
选 搓 它 作为 先辈 拭 降 的 定义 是 否 正 确 ? 

262 一 5 如 何 利用 Floyd - Warshall 算法 的 输出 来 检测 是 否 存在 权 为 负 的 同 路 ? 


. 26.2 一 6 在 Floyd 一 Warshall 算法 中 另 一 种 重建 最 短路 径 的 方法 应 用 了 由， i 上 = 12…m， 其 
中 由 是 从 i 到 j 的 最 短 耻 径 中 具有 最 离 编号 的 中 间 结 点 。 写 出 @i 的 递归 定义 式 ， 静 改过 程 Floyd 


姨 
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一 Warshall 以 计算 再， 的 值 ， 并 用 抱 阵 p = (和 ，) 作答 入 重 写 过 程 PRINT 一 ALL - PAIRS 
-SHORTEST -- P47 万 。 枪 阵 下 与 第 16.1 节 的 矩阵 链 乘法 问题 中 的 s 表 有 何 相 似 之 处 ? 

26.2-7 写 出 一 运行 时 间 为 DOI(VE) 的 算法 来 计算 有 调 图 台 =(Y,E) 的 传递 闭 纪 。 

26.2-8 假定 一 有 向 无 回路 图 的 传递 闭 包 可 以 在 WV:B) 的 运行 时 间 内 计算 ， 其 中 TV,E)= QIV+E) 旧 了 
单调 递增 。 证 明 : 计算 一 般 有 了 疝 圈 的 忧 递 质 包 的 运行 时 间 为 DIV,E))， 


26.3-1 利用 Johnson 算法 找 出 图 26.8 所 求 图 中 每 对 结 点 间 的 最 短路 径 ， 说 明 由 算法 得 出 的 h 值 和 广 
的 值 。 

26.3-2 把 新 结 点 8 加 人 YY 中 得 内 ， 其 目的 是 什么 ? 

26.3 一 3 慨 定 对 斯 青 边 人 oawCE,wfaw 关 00。 那么 加 权 画 数 ww 和 广 有 证 作 关系 ? 


26.4-1 验证 S= (Reej，min，+，cc， 0) 与 S;=(〈(0，1j，YV，A，0，1) 都 是 团 半 环 。 

26.4-2 验证 S = [RUIree，+eoj，min，+，+ce。， 人 向 是 一 拷 半 环 。 对 于 af 迟 ，a+ (~ec) 的 值 是 
多 少 ? (-2e)j + (+Hee) 的 值 又 是 多 少 ? 

26.4-3 使 用 甩 半 环 % 重 写 过 程 COMPUTE-SUMMARTIES 使 其 实现 Folyd--Warshall 算法 。 一 一， 
+eo 的 值 谍 是 多 少 ? 

26.4-4 系统 =【R，+，- ，0，1) 是 闭 半 环 吗 ? 

26.4-5 对 Diikstra 算法 可 以 应 用 人 尾 意 的 闭 半 环 吗 ?对 Belliman-Ford 算法 呢 ? 对 过 程 
FASTER-ALL-PAIRS-SHORTEST-PATH 呢 ? 
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第 二 十 七 竟 ”最 大 流 


为 求 从 一 点 到 另 一 点 的 最 短路 径 ， 可 以 把 公路 地 图 模型 化 为 有 疝 图 。 同 样 , 可 以 把 -- 个 
有 向 图 理解 为 一 个 “ 流 网 络 ", 并 运用 它 来 回答 有 关 物 质 流 的 问题 。 试 设想 从 产生 某 物 质 的 源 
经 过 一 个 系统 流向 消耗 该 物质 的 汇 的 这 样 一 种 物质 流 。 源 以 某 固定 速度 产生 该 物质 ， 并 且 汇 
用 同样 的 速度 消耗 该 物质 。 直 观 上 ， 系 统 中 任何 一 点 的 物质 的 “ 流 "为 该 物质 在 系统 中 运行 的 
速度 。 我 们 可 以 应 用 流 网 络 来 作 流 经 管道 的 液体 ， 通 过 装配 线 的 部 件 、 电 网 中 的 电流 或 通讯 
网 络 传送 的 信息 等 等 的 模型 。 

流 网 络 中 的 每 条 边 可 以 被 认为 是 传输 物质 的 竺 道 。 每 个 管道 都 有 -- 个 固定 的 容量 ， 它 
可 以 看 作 是 物质 能 够 流 经 该 管道 的 最 大 速度 ， 例 如 经 过 一 水 管 的 达到 每 小 时 两 百 加 仓 的 液体 
或 通过 一 段 电线 的 20 安培 电流 。 铺 点 可 看 作 道 问 的 连接 点 ， 并 且 除 源 和 汇 以 外 ， 物 质 只 能 
流 经 这 些 结 点 而 不 能 聚集 在 结 点 中 。 换 名 话 说， 物质 进入 某 结 点 的 速率 必须 等 于 它 离开 该 结 
点 的 速度 ， 我 们 称 这 一 特征 为 “ 流 的 会 话 "。 当 物质 是 电流 时 ， 它 与 基 尔 霍 夫 电流 定律 相同 . 

最 大 流 问 题 是 关于 流 网 络 的 最 简单 的 问题 。 它 提出 这 样 的 问题 , 在 不 违背 容量 限制 的 条 
件 下 ， 把 物质 从 源 传输 到 汇 的 最 大 速率 是 多 少 ? 我 们 在 本 章 中 将 会 看 到 ， 可 由 有 效 算法 来 解 
决 这 一 问题 。 此 外 ， 这 些 算法 使 用 的 基本 技术 也 适合 于 解决 其 他 的 网 络 问题 。 

本 章 提出 了 两 种 解决 最 大 流 问 题 的 一 般 性 方法 。27.1 节 对 流 网 络 和 流 的 概念 以 及 最 大 
流 问题 进行 了 形式 化 定义 。27.2 节 描 述 了 解决 最 大 流 问 题 的 Ford 和 Fulkerson 经 典 方法 . 
27.3 节 给 出 这 一 方法 的 一 种 应 用 ， 即 在 一 无 向 二 分 图 中 寻找 最 大 匹配 。27.4 节 曾 述 了 先 流 
推进 (perflow pmsh) 方 法 ， 该 方法 构成 了 关于 网 络 消 问题 的 很 多 快速 算法 的 基础 。27.5 节 主 
要 论述 了 “向 前 提升 "lift-to 一 fronh) 算 法 ， 该 算法 是 流 前 推 方法 的 一 个 特定 实现 ， 其 运行 时 
间 为 O(V3)。 虽 然 这 一 算法 并 非 目前 最 快 的 算法 ， 但 它 说 明了 崭 近 意义 上 最 快 的 算法 中 应 用 
的 某 些 技术 。 在 实际 应 用 中 该 算法 也 是 非常 有 效 的 。 


27.1 流 网 络 


在 本 入 中 ， 我 们 将 给 出 流 网 络 的 图 论 定义 ， 讨 论 其 性 质 ， 精 确定 义 最 大 流 问 题 。 我 们 还 
要 引信 几 个 有 用 的 记号 .. 


流 网 绪 与 流 


流 网 络 和 =(V，B) 是 一 个 有 向 图 ， 其 中 每 条 边 候 ， 六 6E 均 有 一 非 负 窜 量 ca， 了) 兰 0。 
如 果 (na，v 六 下， 则 假定 cu，=0。 流 网 络 中 有 两 个 特别 的 结 点 ， 源 s 和 汇 t， 为 了 方便 起 
克 ， 假 定 每 个 结 点 均 处 于 从 源 到 汇 的 某 条 路 径 上 , 即 对 每 个 结 点 YEV， 存 在 一 条 路 径 
srwyrnt。 因 此 , 图 G 为 连通 图 ， 且 |EBj> |V 广 1。 

图 27.1 说 明了 一 个 流 网 络 的 实例 。 (a) 关于 EucKky Puck 公司 汽车 运输 问题 的 网 络 所 = 
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(Y， 了 蕊 。(b) G 中 的 流 了 其 值 秆 = 19。 图 中 只 显示 了 正 网 络 流 。 
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图 27.1 一 个 流 网 络 的 例子 


现在 对 流 作出 正式 的 定义 。 设 G= (V，B) 是 一 流 网 络 (其 容量 函数 为 口 。 设 s 为 网 络 的 
源 ，t 为 计 。 问 的 流 是 一 个 实 型 困 数 fVxV-~R, 旦 满足 下 列 三 个 特征 ; 

容量 限制 :对 所 有 um，Yv 志 V， 要 求 fu， 人 所 cfu，y) 

作对 称 性 :对 所 有 u，vCV， 要 求 fu， 纪 = 一 RKv， 

芒 鬼 会 活 : 对 所 有 uv YV-f， 续 ， 要 求 


fu， 避 一 0 
蔓 fr， 妇 称 为 从 缚 点 站 到 结 点 v 网络 流 ， 它 可 以 为 正 ， 也 可 以 为 负 。 流 了 的 倩 定义 为 
人 = >》 SS，Y) f27.1 


朗 为 从 源 出 发 的 全 部 网 络 流 (这 里 记号 | ' 人 | 未 示 流 的 值 ， 并 不 表示 绝对 值 或 势 )。 在 最 大 流 问 
题 中 ， 给 出 了 一 个 具有 源 s 和 汇 t 的 流 网 络 G， 我 们 希望 找 出 从 s 到 t+ 其 值 最 大 的 流 。 

在 者-- 个 有 关 网 络 流 问 题 的 例子 前 ， 让 我 们 简要 考察 一 下 网 络 的 三 个 特征 。 容 量 限制 只 
涪 明 从 一 个 结 点 到 另 一 个 结 点 网 络 流 不 能 超过 设 定 的 容量 。 斜 对 称 性 说 明 从 结 点 到 结 点 
的 网 络 流 是 其 反 向 网 络 薄 求 负 所 得 。 因 此 从 一 个 结 点 到 其 自身 的 网 络 流 为 0。 这 是 因为 ， 对 
所 有 ugV 有 fu， 四 =-~ftu，u， 这 说 明 fu， 由 =0。 

流 的 会 话 性 说 明 从 非 源 或 汇 的 结 点 出 发 的 全 部 网 络 沛 为 0。 根据 矢 对 称 性 ， 我 们 可 以 把 

3》 Ku，v=0 


对 上 所 有 ue V-S， 二 ， 即 进 人 一 个 结 点 的 全 部 责 络 流 为 0。 

问 梓 计 注 意 如 果 商 个 结 点 和 YVv 之 癌 不 存在 边 ， 则 立 和 vv 之 间 也 本 可 能 有 网 络 流 。 如 
条 1U，v 六 吾 用 (v，U 居 上 E， 则 ctu，7=clv， 贡 =0，。 因 此 根据 宅 量 限制 有 ft， 和 0 且 
fv，u<0。 但 因为 根据 斜 对 称 性 ，fa，W= 一 Rv， 巾 ， 所 以 有 fu， 妇 =fv， 由 =0。 因 
此 ， 从 结 点 正 到 结 点 v 有 非 零 网 络 流 意味 着 (u， 太 6E E( 或 两 种 情况 都 成 立 )。 


关于 流 的 特征 的 最 后 一 个 观点 涉及 正 的 网 络 流 。 进 入 一 结 点 Y 的 正 网 络 流 定义 为 : 
了 ， 人 un，V) (073 
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离开 某 结 点 的 正 网 络 流 可 以 对 称 地 进行 定义 。 流 的 会 话 特 征 的 -一 种 阅 述 中 进入 某 非 源 或 
汇 结 点 的 正 网 络 流 必 须 等 于 离开 该 结 点 的 正 网 络 流 。 


网 络 流 揭 一 个 实例 


乃 流 网 络 可 以 把 团 27.1 所 示 的 卡车 运输 问题 模型 化 。Lueky Puck 公司 在 温哥华 有 一 家 
制造 洒 上 井 棍 球 的 工厂 ， 并 且 公 司 在 温 尼 培 格 有 一 个 存 贮 产 品 的 仓库 。Lucky Puck 从 另外 
一 家 公司 租用 卡车 以 把 冰 上 曲 相 球 从 工厂 运 到 仓库 。 因 为 卡车 按 指定 路 线 在 两 城市 问 行驶 且 
其 有 容量 有 限 的 运输 能 力 ， 所 以 在 图 27.1(a) 中 Lucky Puck 每 天 在 每 对 城市 和 v 之 问 至 客 
溉 运 eu， 也) 箱 产品 。Lucky Puck 公司 无 权 控 制 运输 路 线 和 卡车 的 运输 能 力 ， 所 以 也 不 能 改 
变 周 27.1(aj 所 示 的 流 网 络 。 他 们 的 目标 是 确定 每 天 所 能 运输 的 最 大 箱 数 p， 并 按 这 一 数量 进 
衙 生产 ， 因 为 生产 能 力 多 少 对 他 们 的 运输 能 力 则 毫 无 意义 。 

没 任何 卡车 运输 路 线 运输 曲棍球 的 速 庆 是 一 个 流 。 以 每 天 p 箱 的 速度 从 工厂 生产 出 曲 
氢 球 ， 并 且 每 天 这 p 箱 球 必须 到 达 仓 库 。Lucky Puek 公司 并 不 关心 把 曲棍球 从 工厂 运 到 他 
库 需 要 多 少时 间 ， 他 们 关心 的 仅仅 是 每 天 有 Pp 箱 球 离开 工厂 并 且 每 天 有 p 箱 球 到 达 仓 库 。 
容量 限制 是 由 下 列 限 制 条 件 给 出 的 ， 即 从 城市 u 到 城市 v 的 流 Ku， 至 多 为 等 天 ctu。、 颁 
箱 。 在 一 种 稳定 状态 下 ， 球 进 人 运输 网 络 中 某 中 间 城 市 的 速度 必须 等 于 他 们 离开 该 城市 的 速 
度 ， 符 则 球 就 会 堆 集 在 城市 中 ， 因 而 遵循 流 的 会 话 特性 。 因 此 ， 网 络 的 最 大 流 决定 了 每 天 所 
能 运输 逢 数 p 的 最 大 值 ， 

图 27.1(b) 说 明了 用 对 应 于 运输 的 自然 方式 描述 的 一 个 可 能 的 流 。 对 于 网 络 中 任意 两 结 
点 二 和 v， 网 络 流 fu， 习 对 应 于 从 到 v 每 天 fa，) 箱 的 运输 什 务 。 若 fa， 内 为 0 或 负 
值 ， 则 从 到 v 没有 进行 运输 。 因 此 在 图 27.1b) 中 仅 标明 了 具有 正 网 络 的 边 ， 其 后 为 一 等 
线 和 过 的 容量 . 

如 果 我 们 着 重 曾 述 的 两 个 结 点 问 的 运输 ， 就 可 以 在 某 种 程度 上 竟 清 楚 地 了 解 网 络 流 和 运 
输 之 癌 的 关系 。 图 27.2(a) 说 明了 根据 图 27.1 中 流 网 络 中 的 结 点 v 和 vw 归纳 得 到 的 子 图 。 
如 果 Lucky Puck 公司 每 天 从 运输 8 箱 到 v， 则 图 27.2(b) 中 说 明了 其 结论 :从 v 到 的 网 
络 流 是 每 天 8 箱 。 根 据 斜 对 称 性 ， 即 使 我 们 并 没有 把 任何 球 从 到 运输 w， 我 们 也 可 以 说 其 
反方 向 (从 到 到 疝 ) 的 网 络 流 为 每 天 -8 箱 ， 总 之 ， 从 wm 到 ww 的 网 络 流 是 每 关 从 w 运 到 v 的 
箱 数 减 去 每 天 从 mw 到 vi 的 箱 数 。 我 们 表示 网 络 流 的 惯例 是 仅 标明 正 网 络 流 ， 这 是 由 于 他 们 
代表 着 实际 进行 的 运输 ， 





图 27.2 ” 相 消 运算 


现在 让 我 们 增加 一 条 装运 线 ， 即 每 天 从 v: 运输 3 箱 到 vi。 图 27.2(c) 说 明了 对 这 一 绪 果 
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的 一 种 目 然 表示 。 现 在 我 们 得 到 的 情形 是 装运 在 v 和 v: 之 间 双 向 进行 。 我 们 每 天 从 w 装运 
8 箱 到 v 并 且 每 天 从 v 装运 3 箱 到 w， 这 两 个 结 点 间 的 网 络 流 是 多 少 ?从 v; 到 v 的 网 络 流 
是 8-3=5 即 每 天 5 箱 ， 而 从 v 到 vi 的 网 络 流 是 3-8= 一 5， 即 每 天 -5 箱 ， 但 在 (由 中 我 们 可 
以 看 到 ， 实 际 的 装运 仅 在 一 个 方向 上 进行 。 

总 之 , 相 消 运 算 使 我 们 能 够 用 沿 两 个 结 点 间 至 多 一 条 边 方向 上 的 正 网 络 流 来 表示 两 个 城 
市 间 进 行 的 装运 。 如 果 从 一 缚 点 到 另 一 结 点 存在 为 0 或 负 的 网 络 流 , 就 无 需 在 此 方向 王 进行 
装运 。 即 两 个 城市 间 对 球 进 行 双向 运输 的 情形 可 以 通过 相 消 转化 为 与 此 等 价 的 仅 在 某 一 方向 
( 即 指正 网 络 流 的 方向 ) 上 进行 运输 的 情形 。 由 于 我 们 同时 减少 了 两 个 方向 的 装运 , 所 以 不 会 
圳 反 容 量 限 制 。 义 由 于 两 个 结 点 间 的 网 络 流 和 原先 相同 , 所 以 也 不 会 违背 流 的 会 话 限制 。 

在 继续 我 们 的 例子 里 ， 让 我 们 每 天 从 再 运 了 箱 到 w 看 看 其 结果 如 何 。 图 27.2(e)} 说 明 
了 上 述 结 朱 ， 按 惯例 图 中 只 标明 了 正 网 络 流 。 从 到 v 的 网 络 流 变 成 5-7= -2， 且 从 v; 到 
vt 的 网 络 流 变 成 7 5 一 2。 由 于 从 v 到 w 的 网 络 流 为 正 值 ， 所 以 它 表示 每 天 从 m 装运 2 箱 
到 v。 有 从 v 到 v 的 网 络 菠 为 每 天 -2 箱 ， 由 于 该 网 络 流 非 正 ， 所 以 在 此 方向 上 没有 进行 装 
运 。 或 者 ， 在 每 天 从 v 运 到 v 的 额外 7 箱 中 ， 我 们 可 雇 把 其 中 $ 箱 看 作为 取消 每 天 从 v 到 
v 的 5 箱 运输 任务 ， 匀 下 的 2 箱 作 为 每 天 从 v; 到 v 的 实际 装运 箱 数 。 


多 个 源 和 多 个 汇 的 网 络 


一 个 最 大 流 问 题 中 可 以 有 几 个 源 和 几 个 汇 ， 而 并 非 公 有 一 个 源 和 一 个 汇 。 语 如 ，Lucky 
Puck 公司 实际 可 能 拥有 mm 个 工厂 {s，s，…，sj 和 于 个 仓库 各，b，…，tj， 如 图 
27.3(9) 所 示 ， 具 有 五 个 源 8$= {s，s， 的 ，s4，sj 和 三 个 汇 工 = 和， 了 ， 雪 的 流 网 络 。 所 幸 的 
是 这 一 问题 并 不 比 普 通 的 最 大 流 问 题 更 难 。 





本 27.3 把 多 源 多 计 最 大 沽 问题 转换 为 一 个 单 源 单 江 问题 


一 402 一 


我 们 能 够 把 在 具有 多 个 源 和 多 个 汇 的 网 络 中 确定 最 大 流 的 问题 变 为 一 个 善 遂 有 最 大 流 问 
题 。 图 27.3(b) 说 明了 (a) 中 的 网 络 如 果 转 换 为 仅 食 有 单 源 和 单 汇 的 一 个 普通 流 网 络 。 我 们 增 
加 一 个 超级 狐 s， 并 且 对 i=1，2，…， 年 加 和 人 有 向 边 (6，s)， 其 容量 cs，s) 王 ce。 我 们 同 
时 也 创建 一 个 新 的 超级 汇 ft， 并 且 对 j= 1，2，、…, am 加 人 有 向 边 作 ， 量 ， 其 容量 为 ct，D= 
co。 直观 上 ， 人 (网 络 中 的 任意 流 均 对 应 于 (b) 网 络 中 的 一 个 演 ， 反 之 亦 然 。 单 源 s 对 多 个 源 si 
提供 其 所 需要 的 任意 大 的 流 。 园 样 ， 单 汇 t+ 对 多 个 汇 上 消耗 其 所 需要 的 任意 大 的 流 。 练 习 
27.1-3 要 求 从 形式 上 证 明 这 两 个 问题 是 等 价 的 。 


对 流 的 处 理 


我 们 下 面 要 遇 到 一 些 以 流 网 络 中 的 两 个 结 点 作为 生变 量 的 函 教 (如 妇 。 在 本 章 中 ， 我 们 
将 使 用 一 种 耻 含 求 和 记号 ， 其 中 任何 一 个 自 变 基 或 两 个 自 变 量 可 以 是 结 点 的 集合 ， 这 种 记号 
所 表示 的 值 是 对 自 变 量 所 代表 元 过 的 所 有 可 能 的 情形 求 和 。 

例如 ， 如 果 X 和 立 是 结 点 的 集合 ， 册 


fX，Y) 一 2 fx，y 妇 


气孔 料 


又 例如 ， 流 的 会 话 限制 条 件 可 以 表述 为 对 所 有 ug V-ts，tj， 有 fu，V)=0。 辐 样 ， 为 
方便 起 见 ， 在 用 于 隐 含 求 和 记 法 时 ， 我 们 将 省 略 集 合 的 大 括号 。 例如， 在 等 式 fs， 
V- 引 =fs，YV) 中 ， 项 V-s 是 指 集合 V 一 {9}.。 

隐 含 集合 记号 常 可 以 简化 为 有 关 流 的 等 式 。 下列 引 理 给 出 了 有 关 流 和 隐 含 集合 记号 的 几 
个 恒等式 ， 其 证 明 留 作 练习 ( 见 练习 27.1-4)。 

引 理 2.1 设 马 =(V， 阳 是 一 个 流 网 络 ，f 是 各 中 的 一 个 流 。 对 入 ESV， 

fXK，X)=0 
对 其， 和 三 V 

X， 刘 一 一 人 YY，X) 
对 X，Y，ZV， 上 且 X 门 Y= 

fXL iiY，Z=TX，ZJHIY，Z) 
且 fZ， 区 [国王 RZ，XHRZ，Y)。 

作为 应 用 隐 含 求 和 记 法 的 一 个 例子 ， 我 们 来 证 明 一 个 流 的 值 为 进入 汇 的 全 部 网 络 流 ， 即 

目 =Y， 菇 (27.3) 
直观 上 这 是 正确 的 ， 这 是 因为 根据 流 的 会 话 特性 除了 源 和 汇 以 外 的 所 有 结 点 县 有 的 网 络 流 为 
0， 因 此 汇 是 除 源 以 外 唯一 有 非 0 网 络 流 且 能 与 源 的 非 @ 网络 流 匹配 的 结 点 。 形 式 证 明 如 下 : 


此 一 胡 s， 习 ) (定义 ) 
一 全 VY，YV) 一 人 V 一 sS， 细 (由 引 理 27.1) 
一 ftV，YV 一 S) (由 引 理 27.1) 
一 fV，bHUV，V 一 s-t) (由 引 理 27.1) 


=8V， (由 流 的 会 话 
在 本 章 的 后 面 ， 我 们 将 推广 这 一 结论 ( 引 理 27.5)。 
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27.2 “Ford~Fuikerson 方法 


本 节 将 讨论 解决 最 大 流 问题 的 Ford-Fulkerson 方法 。 称 之 为 "方法 * 而 不 是 “算法 *， 是 
由 于 它 包 售 上 有 不 同和 运行 时 间 的 几 种 实现 。Ford- Fulkerson 方法 依赖 于 超越 该 算法 以 外 与 
很 光 有 关 流 的 算法 和 问题 密切 相关 的 三 不 重要 思想 : 残留 网 络 ， 增 广 路 径 和 贿 。 这 些 思 想 是 
重要 的 最 大 流 最 小 割 定理 (定理 27.7) 的 精 人 条。 在 结束 本 节 前 ， 我 们 将 给 出 Ford-Fulkerson 
方法 的 一 种 特定 实现 ， 并 分 析 它 的 运行 时 间 。 

Ford 一 Fulkerson 方法 是 一 种 和 进 代 方法 。 开 始 时 对 所 有 Du，vfvVv 有 有 fa， 四 =0， 即 初始 
状态 时 流 的 值 为 0。 在 每 次 选 代 中 ， 可 通过 寻找 一 条 * 增 广 路 径 "来 增加 菠 值 。 增 广 路 径 可 以 
看 作 从 源 s 到 汇 { 之 问 的 一 条 路 径 ， 沿 该 路 径 可 以 压 人 更 多 的 流 ， 从 而 增加 流 的 值 。 反 复 进 
行 这 一 过 程 ， 直 至 增 广 路 径 都 被 找 出 为 止 。 最 大 流 最 小 制定 理 中 将 说 明 在 算法 终止 时 ， 经 过 : 
这 一 过 程 处 理 可 获得 最 大 流 。 


FORD~EULKERSON METHOD(G: 8， 二 
1 初始 化 流 上 为 0 

2 _ while 存在 一 条 增 广 路 径 

3 do 洛 pb 增 加 兰 了 


4 tetatea 


残留 网 络 


直观 上 ， 给 定 一 流 网 络 和 一 个 流 ， 其 残留 网 络 由 可 以 容纳 更 多 网 络 流 的 边 所 组 成 。 更 形 
式 地 ， 候 设 有 一 流 网 络 G= (V，BE)， 其 源 为 s， 拒 为 t 设 人 为 加 中 的 一 个 流 ， 并 考察 一 对 
结 点 U，vEYV。 在 不 超过 容量 ca， 人 的 条 件 王 从 习 到 我 们 能 够 讨 人 的 额外 网 络 流 的 量 就 
是 人 a，vV) 的 残留 容量 ， 由 下 式 定义 

cu， 术 一 ctu，Y) 一 fu，Y) [27.5) 

例如 ， 如 果 etu， 凡 =16 且 Bu， 允 =11， 则 在 不 超过 边 人 u， 台 的 容量 限制 的 条 件 下 我 们 
可 以 再 传输 cdu，=5 个 单位 的 流 ， 当 网 络 流 Ku， 颁 为 负 值 时 ， 残 留 容量 cgu， 有 大 于 容 
量 cta， 刀 例如 如 果 eu，7=16 且 Nu，、 刀 = 一 ， 册 残留 容量 cku，w) 为 20。 

关于 这 一 点 我 们 可 作 如 下 解释 :从 v 到 存在 -4 个 单位 的 网 络 流 ， 我 们 可 以 通过 从 到 
Y 压 人 4 个 单位 的 网 络 流 来 抵 销 它 。 然 后 在 不 超过 边 避 ， 妇 的 容量 限制 的 条 件 下 我 们 还 能 够 
从 习 到 v 压 人 另外 16 个 单位 的 网 络 流 。 因 此 从 开始 时 的 网 络 流 Ru， 人 = 一 ， 共 压 人 了 额外 
的 20 个 单位 的 网 络 流 , 并 不 会 超过 容量 限制 。 

给 定 一 流 网 络 后 =(V，E) 和 流 f， 由 了 推 得 的 台 的 残留 网 络 是 Gi=(Y，E]， 其 中 

BE 一 {u， mmEVxVicu，v> 0 
这 就 是 说 残留 网 络 中 的 每 条 边 , 或 称 之 为 残留 边 ,能 够 容纳 一 个 严格 为 正 的 两 络 闹 。 图 27.4(a) 
再 次 觉 明了 图 27.1(b) 中 的 流 网 络 如 和 流 研 图 27.4(b) 说 明了 其 相应 的 残留 网 络 Gi。 阴 影 材 善 
的 边 为 增 广 路 径 pb; 其 残留 容量 为 c (p) =eclv，w) =4. (ec) 避 中 根据 残留 容量 导出 的 
流 。(d)] 根据 C 中 的 流 导 出 的 残留 网 络 。 
注意 :即使 边 (0， 风 不 是 下 中 的 边 ， 但 它 也 可 能 是 Ei 中 的 残留 边 。 换 色 话 说 ， 完 全 有 可 
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能 Er 和 E。 鸯 27.4(b) 中 的 残留 网 络 就 包含 了 不 属于 初始 流 网 络 的 这 样 几 条 边 ， 如 (v，s) 和 
(2， 轨 ]。 仅 当 (，u: E 瑟 从 v 到 _u 存在 一 正 网 络 流 时 ， 这 样 一 条 边 (v， 由 才 会 出 现在 人 
中 。 因 为 从 u 到 YY 的 网 络 流 fu， 妇 为 负 值 ， 所 电 cfu，w= ctu，v)fu，V) 为 正 ， 且 (v， 人 由 
& B/。 国 为 只 有 当 两 条 按 (u，。 呈 和 (vy， 蔬 中 昔 少 有 -一 条 边 出 现 于 初始 网 络 中 时 , 边 (u，v) 才 能 
够 基 更 在 残 符 疯 络 中 ， 氛 以 有 如 下 限制 条 件 : 

IE <2IB| 





图 27.4 济 [ 赔 络 及 相应 的 残 图 网 络 


证 意 ， 残 贸 网 络 本 圭 也 是 -一 个 流 网 托 ， 其 容 基 由 er 给 出 ， 下列 引 理 说 明 残 留 网 络 中 的 
流 与 褐 始 网 络 中 流 有 但 关 系 。 
引 理 27.2 设 台 =(V， 思 十 源 为 sS， 汇 为 丰 的 一 个 流 网 络 。 且 了 为 台 中 的 一 个 流 。 设 Gi 
和 二 时 纳 出 的 己 的 残 食 网 络 ， 上 县 了 为 他 中 的 一 个 流 。 则 由 等 式 (27.4) 所 定义 的 流 和 边 是 G 
的 一 合流 ， 其 值 为 ftej = He， 
延期: 我 们 必须 台 证 料 对 称 性 ， 容 量 限 制 和 流 的 会 话 都 得 到 满足 。 半 于 和 斜 对 称 性 ， 对 
则 有 u，v: VY， 和 
(人 HANuU，w= Tu，、vwhHPu，Y) 
= 一 人 iv，U 盖 flv， 1 
一 -人 RUv，UHPI，UD) 
= -HOCu，) 
关于 窜 量 限制 ， 对 所 有 u，v VW，Pfv，; 由 和 ckv，U， 因 此 由 等 式 (27.5) 
(HPu，V) 一 让 b，V)HPD，、W) 
所 人 u，vjHHectu，vi 一 Ku，v)) 
一 ctu，V) 
关于 流 的 会 话 ， 到 对 所 有 uk Y-{s， 上 日 ， 有 
2 ff 二 Pu， 办 一 (ffu，v+Pu，v) 


册 必 下 


一 (fu， 妇 十 2 Pu，W) 


如 眉 村 各 后 寻 
一 0+0 
一 避 
最 后 ， 有 


人 + 们 = 六 人 f+P(Gs，y) 


VEW 


= > (fs，v) +fs，V) 


下 民 寻 


一 fs，V) 十 PS，V) 


YE 则 VEW 


一 | 什 十 罗 
增 广 路 径 


己 知 一 流 网 络 G=({(V， 了 B 和 这 f， 增 广 路 径 p 为 残留 网 络 Gi 中 从 s 到 上 的 一 条 简单 路 
径 . 根据 残留 网 络 的 定义 ， 在 不 违反 边 的 容量 限制 潜 件 下 , 增 广 路 径 上 的 每 条 边 (u， 人 可 以 容 
纳 从 避 到 * 的 某 额 外 正 网 络 流 。 

图 27.4(b) 中 阴影 覆盖 的 路 径 就 是 一 条 增 广 路 径 。 如 果 我 们 把 图 中 的 残留 网 络 Gr 看 作 一 
个 流 网 络 ， 在 不 违背 容量 限制 条 件 下 还 能 够 传输 4 个 单位 的 额外 网 络 流 。 这 是 因为 该 路 径 上 
的 最 小 残留 容量 为 c(w，w)=4。 称 能 够 沿 一 条 增 广 路 径 p 的 边 传输 的 网 络 流 的 最 大 量 为 p 
的 残留 容量 ， 由 下 式 定义 : 

etDp)=minfetu，vi(a， 史 在 上 } 

下 列 引 理 使 上 述 论断 更 加 精确 ， 其 证 明 留 作 练 习 ( 见 练习 27.2 一 7)。 

引 理 27.3 设 G= (V， 了 B) 是 一 个 流 网 络 ，f 是 G 的 一 个 流 ， 并 设 p 是 Gf 中 的 一 条 增 广 
路 径 。 我 们 用 下 式 定义 一 个 函数 :fu V x V 一 了 R: 


ci(p) 如 果 人 nn， 卫 在 pP 上 
re | 如 果 (v， 四 在 p 上 C7.9 
0 符 则 


贡 夺 是 Gi 的 一 个 流 ， 其 值 促 =ctp)>0 

王 殉 推论 说 明了 如 果 我 们 把 了 加 上 名 ， 则 我 们 得 到 台 的 另 一 个 流 ， 其 值 更 接近 于 最 大 
值 。 图 27.4(c) 说 明了 把 图 27.4(a) 中 的 f 吉 上 图 27.4(b) 中 的 所 所 得 的 结 采 。 

推论 27.4 设 G=(V, B) 是 一 个 流 网 络 ，f 是 G 的 一 个 流 ,p 是 Gr 中 的 一 条 增 广 路 径 ， 
设 亿 如 等 式 (27.6) 所 定义 。 通 过 了 = 对 号 定义 一 个 函数 PVxV--R。 则 了 是 G 的 一 个 流 , 其 
什 如 三 馈 +i> 思 。 . 

证 明 : 由 引 理 27.2 和 27.3 立即 可 得 , 


流 爽 络 的 害 
Ford_Fulkerson 方法 沿 增 广 路 径 反复 增加 流 直 至 找 出 最 大 流 为 止 。 我 们 不 久 将 证 明 的 
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最 大 流 最 小 割 定 理 告诉 我 们 : 一 个 流 是 最 大 流 当 且 仅 当 它 的 残留 网 络 不 包含 增 广 路 径 . 不 
过 ， 为 了 证 明 该 定理 ， 我 们 必须 先 来 考察 一 个 流 网 络 的 割 这 一 概念 。 

流 网 络 G= (V，B) 的 割 (S, 站 是 把 V 划分 为 S 和 下 =YV-S, 使 得 sES 上 且 tET。( 除 了 在 此 
我 们 是 对 有 向 图 而 不 是 无 向 图 进行 分 割 且 满足 sES，tCT 这 一 点 以 外 ， 这 一 定义 与 第 二 十 
四 章 中 用 于 最 小 生成 树 的 * 割 "的 定义 相似 。) 如 果 了 是 一 个 注 ， 则 穿 过 割 ($，T) 的 网 络 流 被 
定义 为 TS，T)。 制 (S， 全 的 容量 为 c(S，T). 





图 27.5 图 227.10b) 所 示 的 流 网 络 中 的 割 ({S， 人 


图 27.5 说 明了 图 27.1(b) 中 的 流 了 网 络 的 才 , 其 中 S= {s，v，W 和 T={fw3，va， 甘 。 通 过 
' 该 割 的 网 络 流 为 : 
fv,，Yv3jHfv，v3HYV2，Vv4J 一 12( 一 HL 一 19 
它 的 容量 为 
ctw，YVY3jrhHetv，Vv 一 12+14=26 
注意 ， 通 过 割 的 网 络 流 可 能 包括 结 点 间 的 负 网 络 流 ， 但 拓 的 容量 是 完全 由 非 负 值 组 成 
的 。 
下 列 引 理 说 明 网 络 中 一 个 流 的 值 是 通过 网 络 的 任意 割 的 网 络 流 ， 
引 理 27.5 设 了 是 源 为 s， 汇 为 tt 的 流 网 络 台中 的 一 个 流 ， 并 且 (S$，T) 是 扣 的 一 个 割 。 
则 通过 割 八 ，T) 的 网 络 流 为 fS，T)= 上 自 。 
证 明 : 利用 引 理 27.1， 有 
人 SS，T) 王 从 S，V) 一 LS，S) 
= 人 S， W) 
一 由 S，Y)HRLS 一 s， 人 ) 
一 fs，V) 
和 加 
. 引 理 27.5 的 一 个 直接 的 推论 是 我 们 早先 证 明 过 的 结论 一 一 等 式 (27.3 一 一 一 个 流 的 值 为 
进 人 泡 的 网 络 流 。 
引 理 27.5 的 另 一 个 推论 说 明了 如 何 运用 割 的 容量 来 限制 一 个 流 的 值 。 
推论 27.6 ”一 个 流 网 络 避 中 任意 流 了 的 值 其 上 界 为 日 的 任意 割 的 容量 。 


0 G 中 任意 割 且 f 是 任意 流 。 由 引 理 27.5 和 容重 限制 ， 有 


= 》 3 fu，Vv) 


E 宇 号 上 下 


委 》 efa，J 


一 eLS，7) 

我 们 现在 来 证 明 重 要 的 最 大 流 最 小 割 定理 。 

定理 27.7( 最 大 流 最 小 齐 定 理 ) 如 果 了 是 具有 源 s 和 汇 1 的 流 网 络 各 =(Y，E) 中 的 一 个 
六 ， 则 下 型 条 件 是 等 价 的 ， 

1 是 各 的 一 个 最 大 流 。 

2. 残 留 网 络 G 不 包含 增 广 路 径 。 

3. 对 各 的 基 割 44， 刀 J)， 有 目 =el(S， 古 。 

证 明 : (1)->(2): 为 了 引 人 了 矛盾 ,假设 f 是 G 的 最 大 流 , 但 G; 中 包含 一 条 增 广 路 径 P。 由 
推论 27.4， 流 的 和 行 生 为 避 的 一 个 流 , 其 值 严格 大 于 上 (5 由 等 式 (27. 鲍 给 出 )。 这 与 假设 了 是 
最 大 流 相 记 刷 ， 

(>(33 假设 Gf 中 不 含 增 广 路 径 ， 即 Gr 不 包含 从 s 到 v 的 路 径 。 定 愉 

S=tvEYV:Gr 中 从 s 到 >v 存在 一 条 通路 } 

并 旧 工 =V-S 分 划 (S，T) 是 一 个 割 :s& SS， 且 由 于 G 中 不 存在 从 ss 到 下 的 路 冬 ， 所 以 二 3。 
对 短 对 结 点 utS，vET， 有 了 fu， 由 =clu， 小 理 则 必 ，vi6C El，v 就 属于 集合 S。 因 此 由 
引 | 理 27.5， 目 三 区 S，T) 一 以 S，T)。 

(3)->(D: 由 推论 27.6 可 知 对 所 有 制 ($。 太 ， 有 目 生 cf(S，T 肆 。 因 此 条 件 四 = clCS，T 们 说 明 + 

是 一 个 最 大 流 。 


基本 的 Ford~- ulkerson 算法 


在 Ford-Fulkerson 方法 的 每 次 夺 代 中 ， 我 们 找 出 任意 丧 广 路 径 B 并 把 沿 了 的 流 了 加 上 
其 残留 容量 ckp)。 下 列 算 法 实现 和 通过 更 饭 有 按 相 连 的 和 对 结 点 u，v 之 向 的 网 络 流 fu，v] 来 
计算 出 阁 后 =(V，B) 中 的 最 大 流 。 如 果 下 和 v 之 间 汶 有 边 相 联 ， 则 我 们 由 含 地 假设 fu， 
v=0。 下 列 代 码 假 定 从 习 到 v 的 穿 量 是 由 执行 时 间 为 常数 的 圈 数 egu， 人 提 供 的 ， 且 者 避 ， 
vj# 下 ， 则 cu， 裤 =0。( 在 -一 种 典型 的 算法 实现 中 ， 是 由 存储 于 结 点 和 其 邻接 表 中 的 某 域 推 
导 量 的 )。 残 贸 窜 量 cku， 按 公式 (27.5) 计 算 。 代 硒 中 的 等 号 cfD) 实 际 土 只 是 存储 路 径 p 的 
残 久 容量 的 一 个 临时 变量 。 
Ford--FulkersonfG， 3， 划 
1 fpr 每 条 边 人 na，we E[GI 
?2 gao fta，v]= 0 
fwv，u]e0 
while 在 残 备 网 络 Gy 中 存在 一 菜 从 5 到 1 的 路 径 
do cfphminietu，vifu， 习 在 P 中 } 
for 僚 和 边 加， 内在 间 中 
do fu， 习 =，vY]f+crP) 
flv， 划 < 一 fa，y] 


招生 


Ford-Pulkerson 算法 仅仅 是 早先 给 出 的 FORD-EFULKERSON-METHOPD 的 代码 的 
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扩充 。 图 27.6 说 明了 算法 在 样 图 上 运行 中 每 次 选 代 的 结果 。 第 1-3 行 把 流 了 审 始 化 为 0。 第 
4-8 行 的 while 循环 反复 找 出 心 中 的 增 广 路 径 p 并 把 沿 ?的 流 工 加 上 其 残留 容量 cfp)。 当 
不 再 有 增 广 路 径 时 ， 流 了 就 是 一 个 最 大 流 。 





图 27.6 ”基本 的 Ford-Fulkerson 算法 的 执行 流程 
Ford--Fulkerson 算法 的 分 析 
FORD-FULKERSON 过 程 的 运行 时 间 取 诀 于 如 何 确定 第 4 行 中 的 增 广 路 径 。 如 果 选 
择 不 好 ， 算 法 甚至 可 能 不 会 终 引 : 流 的 值 随 着 求 和 运算 将 不 断 增 加 ， 但 它 甚至 不 会 收 敏 到 流 


的 最 大 值 。 不 过 ， 如 果 我 们 使 用 宽度 优先 搜索 来 选择 增 广 路 径 ， 算 法 的 运行 时 间 为 多 项 式 时 
间 复 杂 性 但 在 证 明 这 点 以 前 ， 我 们 先 对 任意 选择 增 广 路 径 旦 所 有 容量 为 整数 的 情形 取得 一 
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个 简单 的 狠 制 范围 “ 

在 实际 中 碰 到 的 大 多 数 最 大 流 的 问题 中 其 容量 经 常 为 整数 。 如果 容量 为 有 理 数 ， 册 经 过 ， 
适当 的 按 出 例 转 换 可 以 使 它们 都 变 为 整数 。 在 这 一 假设 下 ，FORD-FULKERSON 的 一 种 
简易 实现 的 运行 时 间 为 OGBEI 人 六 ， 其 中 灵 是 算法 找 出 的 最 大 流 。 且 体 分 析 如 下 :第 1--3 行 运 
行 时 间 为 @(E)。 第 4-8 行 的 while 循环 至 多 执行 上 广 | 次 ， 因 为 在 每 次 欠 伐 中 流 的 值 至 少 增加 
一 个 单位 。 

如 果 我 们 能 够 有 效 地 操纵 用 于 实现 网 络 台 =(V，B) 的 数据 铺 梅 ，while 循环 的 效率 就 比 
较 高 。 我 们 假定 有 一 个 对 应 于 有 向 图 名 = (V，E9) 的 数据 结构 ， 其 中 也 = fu vi(u， 了 ERE 
或 (v，m& BE、 了 网络 驯 中 的 边 也 同样 是 G“* 中 的 边 ， 因 此 在 这 一 数据 结构 中 要 保持 其 容量 各 
流 就 非常 简单 了 了， 如果 给 定 台 的 流 f 则 残留 网 络 G 中 的 边 是 G 中 所 有 满足 ctu， 
vVfu，Y) 夫 0 的 边 人 ， 习 所 组 成 的 。 因 此 如 果 我 们 采用 深度 优先 搜索 或 广度 优先 搜索 ， 在 残 
” 留 网 络 中 寻找 一 条 路 径 的 运行 时 间 应 为 DIE)=OD(E)。 所 以 , while 循环 中 的 每 次 迁 代 所 占用 
的 时 间 为 DO(E)， 这 就 使 得 FORD~FULKBERSON 过 程 的 整个 运行 时 间 为 OUEIf* |。 

当 容 量 为 整数 且 最 佳 流 的 值 | 全 | 较 小 时 ，FORD-FULKERSON 算法 的 运行 时 间 还 是 不 
错 的 。 图 27.7(a) 举 了 例 说 明了 在 性 "| 较 大 的 一 个 简单 流 网 络 上 运行 算法 所 产生 的 结果 .在 该 
阿 络 中 一 个 最 大 流 的 值 为 2 000 000:1000 000 单位 的 流通 过 路 径 s-=>u=t， 另 个 1000000 单 
位 的 流通 过 路 径 s-=~v-=t。 如 图 27.7(a)] 所 求 ， 如果 由 FORD-EFULKERSON 找 出 的 第 一 条 
增 广 路 径 为 Sevt， 则 在 第 一 次 选 代 完 成 后 访 的 信 为 1， 算 法 导出 的 残留 网 络 如 图 
27.7(b) 所 示 。 如 果 在 第 二 次 选 代 中 找 出 了 增 广 路 径 s-*v->u-=ff 如 图 27.7(b) 所 示 )， 则 流 的 值 
变 为 2。 图 27.7(c) 说 明了 产生 的 残留 页 络 。 我 们 可 以 在 奇数 次 的 选 代 中 选择 sm=v 一 t 作 
为 增 广 路 径 ， 在 偶数 次 的 选 代 中 选择 sw>Uet 作 为 增 广 路 径 ， 并 如 此 继续 下 去 。 因 为 每 
次 对 流 的 量 仅 增 加 1] 个 单位 ， 所 以 总 共 要 执行 2000 000 次 加 苇 运 算 . 





四 人 人 


图 27 了 运行 FORD--FULKERSON 后 的 残留 网 络 


如 果 我 们 在 第 4 行 用 宽度 优先 搜索 来 实现 对 增 广 路径 p 的 计算 ， 即 如 果 增 广 路 径 是 残 
留 网 络 中 从 s 到 的 最 短路 径 ( 其 中 每 条 边 为 单位 长 ) 则 我 们 能 够 改进 
FORD~-FULKERSON 的 上 下 限 。 我 们 称 FORD-EFULKEERSON 方法 的 这 种 实现 为 
Edmonds-Karp 算法 。 我 们 现在 来 证 明 Edmonds-Karp 算法 的 运行 时 间 为 DIVE)。 

证 明 依 赖 于 残留 网 络 G 中 到 达 结 点 的 距离 下列 引 理 符 导 5Ku， 纪 来 表示 每 条 边 为 单 
位 长 庆 的 图 G; 中 从 下 到 v 的 最 短路 径 长 度 。 

引 理 27.8 如果 对 具有 狐 s 和 汇流 网 络 运 行 Etmonds-Karp 算法 ， 则 对 所 有 结 点 vE 
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V 一 上 .器 ， 残 留 网 络 Gy 中 的 最 短路 径 长 度 bs， 妇 随 着 每 个 流 的 增加 而 单调 递增 。 
证 阴 :; 为 了 引信 耶 盾 ， 我 们 假定 对 某 个 结 点 YEYV-{s， 坪 ， 在 流 增 加 时 ， 引 起 5(s， 颁 
减少 。 设 了 为 增加 以 前 的 流 ， 了 为 增加 以 后 的 流 ， 则 
5(sS，V)<6(， 
不 和 失 一 般 性 ， 我 们 可 以 假定 对 所 有 晴 点 ucE V 一 和 ，tj，01(G， 遇 所 贞 (3S，U， 则 说 明 6r(s， 
<&(s，U。 与 此 等 价 地 ， 我 们 可 以 假设 对 所 有 结 点 E V-fs， 计 
5(S，U<GKs，vV 说 上 明 548， 可 过 Dr(s， 训 {27.7) 
我 们 现在 在 Gr 中 取 一 条 形 如 s uv 的 最 得 路径 并 考虑 路 径 上 先 于 v 的 结 点 U， 因 为 
(u，v) 是 从 s 到 vv 的 最 短路 径 pm 上 的 边 ， 所 以 由 推论 25.2， 有 6r(s， 加 = 6rs，VY) 一 1。 根 据 我 
们 的 恨 设 (27.7?)， 因 此 有 
6(s， 芝 br(S， 凤 
因而 在 结 点 v 和 ua 被 建立 后 ， 我 们 可 以 考察 G, 中 的 流 增加 前 从 u 到 v 的 网 络 流 f。， 若 各， 


如 < ctu，w， 则 有 
5 (s，W 委 Si(s， 荔 十 1 


一 6.fks， 十 1 
=6(s，W 
这 与 我 们 候 设 流 的 增加 使 从 s 到 vv 的 臣 离 闪 少 相 盾 。 

因此 必 有 fu， 如 =ctu， 由 成立， 这 意 昧 着 (人 ，Y) 芝 Er。 呆 

为 得 出 Gr 而 在 G 中 选择 的 增 广 路 径 p 必 和 包含 边 (w， 由 ， 方 向 为 从 Y 到 u， 这 是 由 于 
(au，v& Exv( 人 假设) 和 (人 0，vj 入 Er (刚才 证 明 的 }。 这 就 是 说 ， 沿 路 径 P 增 邦 的 流 把 漆 (u， 仿 的 
流 疝 后 推 ， 并 且 在 p 上 v 上 出 现在 u 之 前 。 因 为 是 从 s 到 ft 的 一 条 最 短 略 径 ， 所 以 它 的 子路 
径 也 是 最 短路 径 ( 引 理 2$.1)， 即 5(s， 世 一 55S，wH1。 

宁 而 ， 

5(s， 们 一 fs， 一 1 
所 好 (5S，V) 一 2 
么 rs，V) 
与 我 们 开始 所 做 的 假 庶 相 政 盾 。 

下 面 一 个 定理 限 币 了 Edmonds-Karp 算 靶 中 的 迷 代 次 数 。 
定理 27.9 如 果 对 具有 源 s 和 汇 ft 的 一 个 流 网 络 G=(V，B) 运 行 Edmonds 一 有 arp 算 
法 ， 对 流 进行 增加 的 全 部 次 数 至 多 为 DO(VBE)， 

证 明 : 在 一 残留 网 络 Gf 中 ， 如 果 其 增 广 路 径 p 的 残 符 容量 是 边 和 名 ， 妇 的 残留 容量 ， 即 
如 果 cfkp)=ctu，V， 则 说 边 促 ， 妇 对 增 广 路 径 3? 是 关键 的 。 在 沿 增 广 路 径 对 流 进 行 增加 
后 ， 该 路 径 上 的 任何 关键 边 便 从 残留 网 络 中 宵 失 了 。 此 外 ， 任 何 增 广 路 径 上 至 少 有 一 条 边 必 
为 关键 边 . 

设 u 和 Yv 为 V 中 的 结 点 且 他 们 之 闻 由 了 中 的 一 条 边 相 连 。 在 运行 Edmonds-- 玫 arp 算法 
的 执行 过 程 中 ，(n，W 可 以 多 少 次 作为 关键 边 ?由 于 增 广 路 径 是 最 短路 径 ， 所 以 当 人 ua，v) 第 一 
次 作为 关键 边 时 ， 有 

ks， 允 一 站 S，1Dj+1 
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一 且 对 流 进行 增加 后 边 (a、W 就 从 残留 网 络 中 消失 。 它 以 后 也 不 可 能 重新 册 现 在 另 -- 
条 增 广 路 径 上 直到 从 u 到 v 的 阅 络 流 喊 小 后 为 止 ， 并 此 只 有 当 侣 ， 妇 出 现在 增 广 路 径 上 ， 这 
种 情况 才 会 发 生 。 姐 打 当 这 …- 囊 件 发 生 时 f 是 司 的 流 ， 则 有 

5rtS、U) 一 SSs、YV) 二 1 
由 于 由 直 理 27.8 可 知 | 64s， 妇 所 Br(s，、vi+Ht， 辽 以 有 
Gr(sS，U 三 吕 人 S，YjHi 
共 避 SS。T 村 上 
= ttS、UJH2 

所 以 ， 从 tn、 成 为 关键 边 的 时 刻 到 它 再 次 成 为 关键 边 的 时 刻 ， 从 源 到 u 的 上 离 至 少 增 
如 2。 韧 始 时 从 源 到 的 陡 离 至 少 为 1， 并 用 直 军 它 党 为 从 源 不 可 达 ( 姻 果 可 能 的 话 ) 之 前 ， 
其 时 部 和 全 多 为 |Vi-2。 亲 此 过 (ua，Yv) 至 多 OUV) 次 成 为 关键 边 . 

因为 在 残留 图 中 下 能 有 DO(E) 对 络 点 各 有 过 相连 、 所 以 在 Edmonds- 和 arp 笑 法 的 整个 执 
行 过 程 中 全 部 关键 边 的 数 日 为 DIVE)。 每 条 增 广 路 猎 至 少 存 在 -- 条 关键 边 ， 因 此 定理 成 
证。 

击 主 在 用 宽度 优先 搜索 溯 找 增 广 路 径 时 FORD-FULKERSON 中 的 每 次 只 代 都 可 以 在 
OO(E) 的 运行 时 间 内 完成 ， 所 以 Edmonds-Karp 算法 的 全 部 运行 时 间 为 O(VE3， 在 27.4 节 
的 算法 中 提供 了 - -种 方法 可 以 取得 OUVE) 的 运行 时 间 ， 这 人 一 方法 是 27.5 节 中 论述 的 运行 
时 间 为 O(V” ) 的 算法 的 基础 ， 


27.3 ”最 大 二 分 匹配 


- 些 组 会 问题 可 己 委 人知 易 地 上 为 最 大 流 问 题 。27.1 节 中 的 多 源 、 多 并 最 大 流 问 题 就 是 
一 个 例 了 ， 其 他 一 些 组 合 问题 从 才 面 上 看 似 平 与 流 网 络 没 有 什么 联系 ， 但 实际 上 可 以 变 汶 最 
大 流 问 是 。 本 节 提 出 这 样 一 个 问题 ;在 一 个 二 分 团 ( 见 第 5.4 节 } 中 寻找 最 大 匹配 ， 为 了 解决 这 
一 人 问题 ， 我 们 和 将 利用 由 FEord-Fulkerson 提供 的 -个 完整 性 性 质 。 我 们 同样 将 看 到 可 以 应 用 
Ford 一 Fulkerson 方法 在 QIVE) 的 这 行 时 间 内 解决 图 马 =(V，E) 的 最 大 一 分 匹配 问题 . 


最 大 二 分 匹配 问题 


荣 定 一 无 问 园 G=(V，B)， 一 个 匹配 是 一 个 边 的 集合 MEE 且 注 足 对 所 有 缚 点 vE V， 
M 中 对 多 有 一 条 边 与 v 关联 。 如 果 M 中 基 条 进 与 关联， 则 说 结 点 vE V 被 号 配 ， 音 则 说 
vY 臣 无 中 配 的 。 最 大 此 了 杞 是 最 大 势 的 匹配 ， 就 是 说 ， 是 满足 对 任意 号 本 M'， 有 |MIzjW| 的 
尼 配 M。 在 本 攻 中 ， 我 们 猪 把 注意 力 集 中 在 寻找 一 分 削 的 各 庆 匹配 上 。 棚 定 结 点 集合 可 被 
划分 为 Y= 工 岂 R， 其 中 工 和 尺 是 不 相交 的 . 是 E 中 的 康 李 过 的 … 全 端点 在 R 中 ， 另 -一 个 端 
民 在 工 中 。 图 278 说 明了 匹配 的 概念 。 结 点 分 划 为 Y= 开 | 妆 。(a)，、(by 分 别 为 两 个 号 
配 . 

二 分 图 的 最 大 匹配 问题 有 着 许多 实际 的 应 用 。 例 如 ， 把 一 机 器 集合 三 和 要 同时 完成 的 
任务 集合 R 相 正 配 。E 中 有 过 ftu， 人 内 说 明 一 台 特 定 机 器 uc 能 够 完成 一 项 特定 任务 vC 
R。 最 大 近 配 可 以 为 尽 可 能 风 的 机 器 提供 任务 ， 
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图 27.9 ”相应 于 二 分 蔷 的 流 网 络 


寻求 量 大 二 分 匹配 


我 们 能 够 运用 Ford-Fulkerson 方法 在 关于 |Vl 和 | 本 的 多 项 式 时 间 内 找 出 泡 向 二 分 图 
G=({(V，E) 的 最 大 匹配 。 关 键 在 于 建立 一 个 流 网 络 ， 其 中 流 对 庶 于 匹配 ， 如 图 27.9 所 示 。 
我 们 对 二 分 攻 扣 的 相应 流 网 络 如 =(V“E ?定义 如 下 。 设 源 s 和 汇 t 是 不 属于 V 的 新 结 点 ， 
V=YVUls 日。 如果 G 的 结 点 分 划 为 Y= 工 UR，G/ 的 有 向 边 由 下 式 给 出 ， 

E 一 ts，uhute 工 凡人，vwincELweR，mDEEILUHNC，UDvcR} 
在 结束 构造 工作 之 前 ， 我 们 对 E' 中 的 每 条 边 赋 了 予 单位 容量 . 

下 列 定 理 说 明 各 的 匹配 直接 对 应 于 G 的 相应 流 网 络 G“ 中 的 流 。 如 果 对 所 有 (a， 亡 立 
xV，fu.v) 是 一 整数 ， 则 说 流 了 网 络 扣 =(VY，BE) 上 药流 了 是 具有 整数 值 的 。 

引 理 27.10 设 G=(VY，B) 是 一 二 分 图 ， 其 结 点 分 划 为 V= 工 JR 设 G=(V，E) 是 
它 相应 的 流 网 络 ， 如 果 M 是 避 的 中 配 ， 则 台中 存在 一 整数 值 的 访 六 且 目 =1M。 相 反 地 ， 
如 果 f 是 刁 " 中 的 整数 值 访 ， 则 G 中 有 在 一 匹配 M 满 是 |IM| = 目 。 

证 明 ; 我 们 先 来 证 明 G 的 匹配 M 对 应 于 台中 一 整数 值 的 流 。 定 文子 如 下 。 如 果 必 ， 颁 
KM， 则 fs， 名 一 几 u，W=fv， 妇 一 1 且 fa，s)= 人 vv， 由 =ft， 帮 =-1。 对 所 有 其 他 按 他 ， 
VE'， 我 们 定 文 Fu， 人 岂 =0。 


一 413- 一 


直观 上 ， 每 条 边 (a， 人 六 E M 相应 于 G/' 中 又 过 路 径 suv->t 的 1 个 单位 的 流 。 此 外 ， 
除了 s 和 ft 外 ， 由 M 中 的 边 引 贡 的 各 路 径 上 的 结 点 都 是 各 不 相同 的 。 为 了 验证 f 的 确 满足 
疼 对 称 性 、 容 量 限 制 和 流 的 会 话 三 个 特征 ， 我 们 仅 懂 注意 到 :可 以 通过 沿 这 样 一 条 路 径 对 流 
进行 增加 来 取得 f。 通 过 割 (LL sj，RUJft) 的 网 络 流 应 等 于 |MI|， 因 此 根据 引 理 27.$， 流 的 
值 为 自 =|MI， 
为 了 证 明定 理 的 后 一 部 分 或 立 ， 设 f 为 G' 中 一 个 具有 整数 值 的 流 ， 并 设 
M={u，vuk6L，vER， 且 fu，v>0} 

对 每 个 结 点 mEE， 仅 有 一 条 进 人 该 结 点 的 边 ， 即 (4，U， 其 容量 为 1， 因此 对 每 个 结 点 
ugL， 至 多 有 1 个 单位 的 正 网 阁 流 进 入 该 结 点 。 由 于 下 的 值 为 整数 ， 所 以 对 每 个 结 点 ueE 
L， 有 1 个 单位 的 网 络 消 进入 当 且 仅 当 恰 有 一 结 点 vE 及， 满足 fu， 玉 = 1， 

因此 ， 至 多 只 有 一 条 离开 每 个 结 点 uEL 的 边 传输 正 网 络 流 。 对 每 个 结 点 vE 尺 也 有 一 
对 称 性 的 结论 。 因 此 定理 中 定义 的 集合 M 是 一 个 匹配 。 

为 证 明 |IM|I= 目 ， 注 意 到 对 每 一 个 被 匹配 的 结 点 uEL， 有 fs， 世 = 1， 并 且 对 每 条 边 
(u，YJ6 E-M， 有 fa，v=0。 轴 此， 根据 引 理 27.1， 斜 对 称 性 以 及 从 工 到 t 兴 有 边 相 连 ， 
我 们 得 到 

IMI= 攻 L， 及 ) 
= 人 LDL，YV 广 L，L)RL，s 关 RL， 总 
一人-0HAS， 工 六 
一 克 s，YV 
= 上 自 

在 直观 上 ， 图 G 的 一 个 最 大 匹配 对 应 于 流 网 络 G* 中 的 一 个 最 大 流 。 因 此 我 们 可 以 通过 
对 G' 运 行 最 大 流 算法 来 计算 出 台 的 最 大 匹配 。 这 一 推理 过 程 中 存在 的 唯一 障碍 是 最 大 消 算 
法 可 能 返回 一 个 G' 的 非 整数 量 的 流 。 下 列 定理 说 明 ， 如 果 我 们 使 用 Ford-Fulkerson 方法 ， 
这 一 困难 就 不 会 出 现 。 

定理 27.11( 完 整 性 定理 ) 如 果 闪 量 函数 c 上 只 取 整 数值 ， 则 由 Ford 一 Fulkerson 方法 得 出 
的 最 大 流 了 满足 目的 值 为 整数 。 此外， 对 所 有 结 点 和 v，fru， 站 的 值 为 整数 ， 

证 明 : 通过 对 迭代 次 数 归纳 来 进行 证 明 。 

具体 证 明 留 作 练 习 ( 见 练习 27.3-2)。 

我 们 现在 可 以 证 明 引 理 27.10 的 推论 。 

推论 27.12 ”二 分 图 G 的 最 大 匹配 的 势 是 其 相应 的 流 网 络 G' 的 最 大 流 的 值 。 、 

证 明 ; 我 们 使 用 引 理 27.10 中 的 术语 。 假 定 M 是 局 的 一 最 大 匹配 , 上 且 其 相应 的 G 中 的 - 
流 上 不 是 最 大 流 , 则 G' 中 必 有 一 最 大 流 名 满足 下 > 和 掉 。 由 于 G' 中 的 容量 均 为 整数 ， 则 由 定理 
27.11 可 知 f 的 值 也 为 整数 。 因 此 ，f 对 应 于 台 中 的 匹配 M'， 且 其 势 |M4 = 上 自 > 目 =|MI， 这 
与 M 是 最 大 匹配 的 假设 相 矛 项 。 用 同类 似 的 方法 可 以 证 明 , 如 果 f 是 G“ 的 最 大 流 ， 其 相应 
的 匹配 是 G 上 的 最 大 匹配 。( 证 毕 ) 
因此 ， 对 于 一 无 疝 二 分 图 G， 我 们 可 以 攻 下 列 方法 找 出 其 最 大 匹配 : 先 建立 流 网 络 G/， 
对 它 运 行 Ford--Fulkerson 方法 ， 根 据 求 得 的 共有 整数 值 的 最 大 流 工 就 可 直接 获得 最 大 匹配 
M。 因 为 二 分 图 土 的 任何 匹配 的 势 至 多 为 min(L，R)=OV)， 所 以 G 中 最 大 流 的 值 为 
O(V)。 因 此 .我们 可 以 在 O(VE) 的 时 间 内 找 出 一 个 二 分 图 的 最 大 匹配 。 
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27.4 先 流 推进 算法 


在 本 节 中 ， 我 们 要 介绍 计算 最 大 流 的 * 先 流 推进 *(preflow~push) 方 法 。 目 前 关于 最 天 流 
问题 的 最 快速 算法 就 是 先 流 推进 算法 。 其 他 有 关 流 的 问题 ， 如 最 小 代价 流 问题 ， 也 可 以 有 效 
地 用 先 流 推 进 方法 解决 。 本 和 节 中 要 介绍 Goldberg 的 "一般 性 ?最 大 流 算法 ， 该 算法 的 一 种 简 
单 实现 的 运行 时 间 为 O(V?E)， 这 是 对 Edmonds-Karp 算法 的 O(VE2 时 间 的 一 种 改进 . 
27.5 节 中 对 一 般 性 算法 进行 了 精 化 , 得 到 另外 一 种 运行 时 间 为 DCV ) 的 流 前 推进 算法 . 

相对 于 Ford-Fulkerson 方法 来 说 ， 先 流 推进 算法 采用 的 是 一 种 更 局 部 化 的 方法 。 它 不 
是 检查 整个 残留 网 络 来 找 出 增 广 路 径 ， 而 是 每 次 仅 对 一 个 结 点 进行 操作 , 并 且 仅 检查 残留 网 
络 中 该 结 点 的 相 邻 结 点 。 此 外 ， 与 Ferd--Fulkerson 方法 不 同 ， 先 流 推进 算法 在 其 执行 过 程 
中 并 不 能 保持 流 的 会 话 特性 。 但 是 ， 该 算法 保持 了 一 个 “ 先 流 (preflow)”， 它 是 一 个 画 数 下 V 
x V 一 及 , 它 满足 斜 对 称 性 、 容 量 限制 和 下 列 放 宽 条 件 的 流 的 会 话 特性 :对 所 有 鱼 点 UE& 
V-fsl， 有 ftV， 由 z0。 亦 即 , 进 人 只 源 结 点 外 的 网 络 流 为 u 的 余 流 (excess fiow)， 由 下 式 
给 出 : 

ef) 一 凡 Y，U) (27.8) 
对 utgYV- 和 ，t 如 果 eg 由 >0， 则 说 结 点 谥 出 。 

我 们 将 先 描述 先 流 推进 方法 所 包 售 的 直觉 知识 , 然后 讨论 该 方法 使 用 的 两 种 操作 : “推进 ” 

先 流 和 “提升 * 结 点 。 最 后 ， 我 们 将 给 出 一 般 性 先 流 推进 算法 并 分 析 其 正确 性 和 运行 时 间 。 


直觉 知识 


如 果 用 攻 流 的 形式 来 描述 , 先 流 推 进 方法 所 包含 的 直觉 针 识 大 概 最 容易 懂 了 :我 们 把 一 个 
流 网 络 G=(V，BE) 看 成 具有 给 定 和 容量 且 互 相连 接 的 管道 所 组 成 的 一 个 系统 。 如 果 把 这 个 比 
方 应 用 到 Ford-Fulkerson 算法 中 ， 就 可 以 说 网 络 中 的 每 一 条 增 广 路 径 均 引 发 出 一 条 无 分 枝 
点 . 且 从 源 到 汇 的 额外 流体 流 Ford--Fulkerson 方法 以 选 代 方 式 加 入 更 多 的 流 直至 不 能 加 人 
为 止 。 

一 般 性 先 流 推进 算法 的 直观 性 在 某 种 程度 上 来 说 是 与 上 述 不 一 样 的 。 和 先前 一 样 ， 图 的 
有 癌 边 对 应 于 管道 。 而 作为 管道 接合 点 的 结 点 却 有 着 两 个 有 趣 的 特性 。 第 一 ， 为 了 容纳 余 
流 ， 每 个 结 点 均 有 一 个 排出 管 遵 能 向 能 积聚 液体 的 任意 大 容量 水 库 。 第 二 ， 每 个 结 点 和 它 的 
水 库 以 及 所 有 的 管道 连接 点 都 处 于 一 个 平台 上 ， 当 算法 向 前 推进 时 ， 平 台风 之 逐渐 升 高 。 

结 氮 的 高 度 决 定 了 如 何 推进 流 : 我 们 仅仅 把 流向 下 推 ， 即 从 较 高 结 点 向 较 低 结 氮 推 。 从 
较 低 结 点 到 较 融 结 点 可 能 存在 一 正身 网络 流 ， 但 是 对 流 的 推进 总 是 阿 下 推 。 源 的 度 固定 为 
Il|， 汇 的 高 度 而 定 为 0。 所 有 其 他 结 点 的 高 度 开 始 时 都 是 0 并 逐步 增加 。 算 法 首先 从 源 输送 
尽 可 能 多 的 流下 到 汇 。 它 输 送 的 量 恰好 足够 填 满 从 源 出 发 的 每 条 管道 ， 即 它 输送 的 量 为 齐 
(，V-~S) 的 和 容量。 当 流 第 一 次 进入 一 个 中 间 结 点 时 ， 它 聚集 在 该 结 点 的 水 库 中 ， 并 且 最 终 
将 从 那里 被 继续 向 下 推进 。 

最 终 可 能 会 发 生 下 列 情 况 ， 离 开 某 结 点 u 且 还 未 被 充满 的 唯一 管道 所 连接 的 结 点 与 
等 高 或 高 于 u。 在 这 种 情况 下 ， 为 了 使 某 谥 出 结 点 u 摆脱 其 余 流 ， 我 们 必须 增加 它 的 高 度 
一 一 一 个 称 之 为 “提升 " 结 点 的 操作 。 我 们 把 的 高 度 增 加 到 比 其 最 低 的 相 邻 结 点 的 高 度 
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商工 个 单位 (从 到 该 结 点 必须 有 一 条 未 充 请 的 管道 )。 夫 此 当 一 个 结 点 被 握 升 后 ， 至 少 存在 
一 条 流出 管道 并 可 能 通过 它 推 进 更 多 的 流 . 

最 终 ， 有 可 能 达到 访 的 所 有 流 均 到 达 并 .。 因 为 管道 服从 容量 限制 ， 并 且 通 过 作 何 央 的 流 
的 量 依然 受到 制 的 容量 跟 制 ， 所 以 这 时 再 没有 流 能 到 达 汇 。 为 了 使 先 流 成 为 “合法 " 流 ， 算 法 
通过 继续 把 结 点 握 升 到 高 于 源 的 抬 定 高 度 |Vl| 来 把 会 阳 在 淮 出 结 点 的 水 库 中 的 余 流 送 回 给 源 
(把 余 流 送 回 源 的 操作 实际 上 是 通过 取 淡 产生 这 -- 过 剩 的 流 米 完成 的 ) 。 如 我 们 将 要 看 到 的 
那样 -一 导 所 有 的 水 库 均 为 宅 ， 先 流 不 仅 是 "合法 " 流 ， 而 上 且 也 是 最 大 流 。 


基本 的 操作 


从 前 面 的 讨论 中 、 我 们 知道 先 流 推进 算法 中 要 执行 两 个 基本 操作 :把 流 的 余 量 从 一 外 结 
点 推进 到 它 的 一 个 相 坑 结 点 和 提升 一 个 结 点 。 运 用 哪 种 操作 取决 天 结 点 上 的 高 度 。 现 在 我 们 
给 出 结 点 商 度 的 精确 定义 。 

设 台 =(V，E) 是 一 个 流 网 络 ， 其 源 为 8S， 汇 为 t。 设 了 是 绳 的 一 个 先 流 ， 如 果 天 数 hV 
-~*N 满足 hs)=IVI，blb0=0， 且 对 每 条 残留 边 (0o，V)EE， 有 

hfu) 和 hv)+l 

则 汞 数 了 为 痪 度 请 数 。 我 们 立即 可 得 下 列 引 理 。 

引 理 27.13 设 怠 =(V，B) 是 一 个 流 网 络 . 了 是 局 的 先 流 、，h 是 定义 在 V 上 的 高 度 函 
数 ， 对 任意 两 结 点 u，v“V， 如 果 htu)>h(vitl、 则 (aa，w 不 是 残留 图 中 的 边 。 

如 果 u 是 某 汶 出 绪 点 egub，W>0 且 hm=htvwtrHi， 则 可 以 订 用 基本 操作 PUSHK(u， 
Vi。 下 列 伪 代码 对 隐 式 给 出 的 网 络 扣 =(V，E) 中 的 流下 进行 更 新 。 它 假定 容量 由 一 个 常数 时 
何 的 函数 ec 给 出 , 并 再 对 给 定 的 c 和 f， 也 可 以 在 常数 时 间 内 计算 出 残留 窜 量 。 存 贮 于 结 点 a 
的 余 流 用 elu] 表 示 ，u 的 电 度 用 hf 由 表示。 符号 dgu，V) 是 存 贮 能 够 从 u 推进 到 v 的 流 的 量 
的 一 个 临时 变量 。 

PUSHI，Y) 
1 必 应 必 于 u 是 溢出 结 点 ，cfu，vj>0 日 hu=ivHhl 
上 操作 ， 有 从 哩 推进 dku，vwi= minte[ 可 ，cdgu， 四 ) 单 位 的 流 到 v 
diu，vYj=-miinte[g，cdu，v) 
fu，v]effu，vHdlu， 颁 
寻 ，ul= 一 ffu，v] 


e[u]=e[-dtu，Y) 
e[v]*-e[v]+dku，Y) 


"< 人 ha 


PUSH 的 代码 执行 如 下 。 假 定 结 点 a 有 一 正 的 余 量 e[u] 且 (a， 人 的 残留 容量 为 正 。 我 们 
能 各 从 u 传输 min(eful，cdu，v) 单 位 的 章 到 缚 点 w 并 不 会 使 elu 变 成 负 值 或 超出 容重 
ctu，vV)。dku，yv) 的 值 是 在 第 3 行 中 计算 的 。 通 过 第 4-5 行 中 更 新 f 和 第 6-? 行 中 更 新 。， 
可 以 把 流 从 _u 移 到 v。 困 此 ， 如 果 在 调用 PUSH 之 前 f 是 先 流 ， 则 调用 后 它 依然 为 先 六 ， 

注意 ，PUSH 的 代码 中 没有 涉及 au 和 Yv 的 高 度 ， 我 们 将 吕 免 涉及 它们 除非 
h[ 可 =h[vjH-1。 因 此 余 流 仅 在 高 度 差 为 1 时 才 被 向 下 推进 。 由 引 理 27.13 可 知 ， 两 个 结 点 的 _ 
高 度 差 大 于 1 时 ， 它 们 之 间 不 可 邓 存 在 残留 边 ， 所 以 在 高 度 差 大 于 于 时 允许 对 流向 下 推进 则 
雍 无 意义 。 
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我 们 称 操 作 PUSHIu，v}) 是 一 个 从 到 Yv 的 推进 ， 如 洒 推 进 操作 通用 于 离开 结 点 u 的 基 
边 介 ，vJ、 则 我 作 世 亲 以 说 推进 操作 适用 于 u。 如 果 边 上， 旨 变 为 饱和 (推进 后 cku， 妇 一 小 ， 
则 该 推进 是 饱和 推进 ，、 香 则 就 是 -个 不 例 和 推进 ， 如 果 -条 边 是 饱和 的 ， 则 它 不 会 出 现在 残 
饥 网 络 中 ， 

如 果 是 洪 岂 结 点 , 上 对 所 有 结 点 v，cfu， 刀 >0 薄 含 hf 可 系 hfvy]， 则 可 以 度 用 基本 操作 
LIFT(o)。 换 句 话说， 已 知 流出 结 点 u， 如 果 对 从 到 v 还 存在 残留 容量 的 等 一 个 结 点 V， 
由 于 v 的 高 度 示 在 u 之 下 而 使 我 们 不 能 把 流 从 推进 到 v， 则 此 时 可 以 提升 溢出 缚 点 u。{ 回 
忆 一 下 定义 可 知 ， 源 s 或 汇 【 都 不 斌 能 是 溢出 结 点 、 因 此 s 利 ! 都 不 能 被 提升 。) 

LIFTLu) 

1 ~， 适用 于 :0 是 江 出 缚 战 虹 对 所 有 v4 Yu，v: RE, 昔 合生 可 反 h[v] 
2 ， 择 作 :增加 的 高 度 

3 hul-1i+minfhbfvjtu，v ;| 


当 我 们 调用 探 作 LIFTC 计 ， 说 下 被 提升 。 注 意 当 由 被 提升 时 ，E 必须 至 少 包 念 一 条 
离开 的 边 , 以 使 上 述 代码 中 的 min 运算 不 会 在 空 集 上 执行 。 从 让 为 溢出 结 点 的 假设 可 知 这 
一 情况 是 成 立 的 。 由 和 etul>0， 有 eu=fIV， 本 >0， 人 多 而 至 少 存在 一 个 结 点 v 满足 人 fv， 
吕 >0， 人 和 但 旺 

cftu，W)= clu，vY) 一 fu，y 了 ]= ca，Y)+fltu， 可 > 

这 说 明 (a， 罗 、E,。 因 此 , 操作 LIFT 合 下 站 商 度 蝴 数 约 束 下 其 有 所 多 许 的 最 大 商 

度 。 . 


一 般 性 算法 
一 般 性 先 流 推 进 算法 使 用 下 列子 例 程 在 流 网 络 中 建立 一 个 初始 先 流 。 


INLTI 和 ALTZE 一 忆 REPFLOWLG，S 
1 for 妊 个 站 点 UV[G] 
了 gohlu]= 恬 

了 us 

4 foer 每 杀 册 tu， 习 BE[G] 
5 do 攻 ，、] = 站 

则 fr，u]<=-0 

7 hgsls 人 [G] 

5 for 生 个 引 点 了 站 由 鸭 ] 
de gfs，uj= 避 s，] 

1 ifu，sls 一 fs，ad] 
11 e[D]= et，U) 


INITIALIZE-PREFLOW 建立 的 初始 先 庆 g 定义 为 
ctu，wV) 车 QU 一 
flu,y] = 一 ctu，v) 若 v 一 (27.9) 
0 香 则 


即 每 杀 离 于 流 的 边 补 充满， 而 其 他 所 有 边 不 运载 任何 流 。 对 每 个 与 洲 邻 接 的 铺 点 vY， 开 始 时 
有 elv]= els，v)、- 一 般 性 算法 中 也 对 疝 度 男 数 h 进行 了 声 始 化 。8 由 下 式 给 出 : 
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|VY| 如 果 u = S 
hru] = { 0 否则 
为 满足 hu> hf[y]+l1 的 边 仅 是 那些 u=s 的 边 ， 并 且 那 些 边 是 狗 积 的， 这 意味 着 它们 不 
在 残留 网 络 中 ， 所 以 说 该 函数 为 高 度 琐 数 。 
下 列 算法 可 作为 先 流 推进 方法 的 典型 应 用 。 
GENERIC-PREFLOW-PUSHIG) 
1 INITIALIZE-PREELOW{IG， 对 
2 while 存在 适当 的 推进 或 提升 操作 
3 do 选择 适当 的 推进 或 提升 操作 并 执行 


在 对 流 进行 初始 化 后 ， 一 般 性 算法 在 适当 地 方 以 任意 顺序 反复 应 用 基本 操作 。 下 列 引 理 
告诉 我 们 : 只 要 在 在 溢出 结 点 ， 那 么 两 个 基本 操作 中 至 少 有 一 个 适用 。 

. 引 理 27.14( 谥 出 结 点 要 各 可 以 被 推进 ， 要 人 么 可 以 被 提 和 办) 设 台 =(VY， 了 是 一 个 流 网 络 ， 
源 为 s， 汇 为 t，f 为 一 先 流 。 设 h 是 了 的 任意 高 度 函 数 。 如 果 是 任意 洲 出 结 点 ， 则 推进 操 
作 或 提升 操作 适用 计 该 结 点 。 

证 明 : 对 任意 残留 边 (，v， 由 于 h 是 高 产 函 数 ， 所 以 有 ho 和 hftvw)j+1。 如 果 推 进 操作 
不 适用 于 u， 则 对 所 有 残留 边 名 ， 裤 ， 必 须 有 ha)<hfwrl 成 立 。 这 说 明 hu 和 htw， 因 此 
此 时 提升 操作 适用 于 u。( 证 毕 ) 


先 流 推进 方法 的 正确 性 


为 了 说 明 一 般 竹 先 流 推进 算法 解决 了 最 大 流 问题 ， 我 们 将 首先 证 明 如 果 算 法 终止 ， 则 先 
流下 为 一 最 大 流 。 我 们 过 后 将 证 明 算法 能 够 终止 。 我 们 先 来 看 看 高 度 本 数 h。 

引 理 27.15( 结 点 商 度 不 会 碱 小 ) 在 GENERIC-PREFLOW-PUSH 对 流 网 络 G=(V， 
E) 的 执行 过 程 中 ， 对 每 个 结 点 EV， 其 高 度 hm] 不 会 碱 小 。 此 外 ， 对 结 点 应 用 查 升 操作 
时 ， 其 高 度 h[u] 至 少 增加 1.。 

证 明 : 因为 结 点 的 高 度 仅 在 提升 操作 中 变化 ， 所 以 上 只 要 证 明 弛 理 的 第 二 个 论断 就 足够 
了 。 如 果 结 点 u 袜 提升 ， 则 对 所 有 满足 mm，WEBE 的 结 点 v， 有 hf 和 hv 这 说 明 
gul< 1+Hminfthv: ua，v6C ET 因此 该 操作 必 使 hf 增加 。 

引 理 27.16 设 台 =(V，B) 是 一 个 流 网 络 ， 其 源 为 s 汇 为 t。 在 GENERIC 一 
PREFLOW-PUSH 对 各 的 执行 过 程 中 ， 属 性 h 始终 为 高 度 函数 。 

证 明 : 我 们 通过 对 执行 的 基本 探 作 次 数 进行 归纳 来 证 明 结 论 。 初 始 时 我 们 已 经 在 上 面 证 
明 过 h 是 商 度 函数 。 

我 们 认为 如 果 f 是 高 度 函 数 ， 则 执行 操作 LIFTCu) 后 h 仍然 是 高 度 函 数 。 如 果 我 们 观察 
一 下 离开 u 的 残留 入 (nu，ve Er， 刚 操作 LIETOD 保 证 其 后 有 h[u 和 过 hiv]+1。 

现在 我 们 来 考虑 进入 的 残留 边 (w， 由 由 引 理 27.1$ 可 知 ， 在 操作 LIEFT(mD 之 前 h[w] 
<h[u]l+I 意 指 操作 后 有 Hjw]<hrm+li。 因 此 操作 LIFT(D 使 h 仍 为 高 度 函 数 。 

现在 来 考虑 操作 PUSH(u，v)。 这 一 操作 可 能 把 边 人 ay) 加 人 HE 中 ， 也 可 能 把 边 (u wy) 从 
FE 中 去 掉 。 在 前 一 种 情况 下 ， 有 h[v]=bhruj-1， 因 些 h 仍然 是 高 度 郴 数 。 在 后 一 种 情况 下 ， 
从 残留 网 络 中 去 掉 边 (u.y) 也 就 去 掉 了 相应 的 限制 条 件 ，h 也 仍然 基 高 度 函 数 。( 证 毕 ) 
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下 列 引 理 给 出 了 高 度 苑 数 的 一 个 重要 性 质 。 

引 理 29.17 设 G=(VY，BE) 是 一 个 流 网 络 ， 其 源 为 s， 汇 为 t 设 了 是 G 的 一 先 流 ,h 是 
定义 在 V 上 的 高 度 函 数 。 则 在 残留 网 络 Grf 中 不 在 在 从 源 s 到 汇 t 的 路 径 。 

证 明 : 为 了 引信 秘 盾 ， 人 恨 定 在 G 中 从 s 到 上 存 在 一 条 路 径 p= <vo，VvV， …，W>， 其 
Yo 一 sS，W 一 t。 不 失 一 般 性 ，p 是 一 条 简单 路 径 ， 所 以 上 <]VI。 对 i=0，1， 人 …，k~1， 过 
(vi，VHDEc Er 因为 上 是 高 床 函 数 ， 扩 以 对 i=0，1，…，k-1， 有 hshGvari。 把 路 径 
p 上 的 这 些 不 等 式 联合 起 来 可 得 hsj 和 h(b+k。 但 由 于 h(D=0， 有 hs)j 和 k<|VI， 这 与 我 们 
对 商 麻 函 数 的 要 求 hfs)= |VI 相 矛盾 。( 证 毕 } 

现在 我 们 可 以 证 明 如 果 一 般 人 性 先 流 推进 算法 终止 ， 它 计算 出 的 先 流 为 最 大 流 。 

定理 27.18( 一 般 性 先 流 推进 算法 的 正确 性 ) 当 算 法 GENERIC-PREFLOW-PUSH 在 
具有 谣 s 和 汇 t 的 流 网 络 台 =(V，B 本 上 运行 时 ， 若 算法 终止 ， 则 它 计算 出 的 先 流 节 为 局 的 
最 大 流 。 

证 明 : 如 果 一 般 性 算法 终止 ， 则 每 个 属于 V 一 fa，ftj 的 缚 点 其 余 流 一 定 为 0， 这 是 因为 由 
引 理 27.14 和 27.16 以 用工 总 为 先 流 的 不 变 条 件 可 知 ， 不 存在 浅 出 结 点 。 所 以 了 是 一 个 流 。 
因为 h 是 高 度 晒 数 ， 所 以 由 引 理 27.17 在 残留 网 络 Gi 是 不 存在 从 s 到 的 路 径 。 因 而 根据 
最 大 深 最 小 割 定理 可 知 T 是 一 个 最 大 流 。( 证 毕 ) 


先 流 推进 方法 的 分 析 


为 了 说 明 一 般 性 先 流 推进 算法 确实 会 终 幅 ， 我 们 将 给 出 其 执行 操作 次 数 的 限制 范围 。 对 
于 这 三 种 类 型 的 操作 (提升 .. 饱和 和 推进 和 不 饱和 推进 ) 中 的 每 一 种 ， 我 们 将 分 别 给 出 其 限制 
范围 。， 有 了 这 些 限 制 范围 的 知识 后 ， 构 造 一 个 运行 时 间 为 O(V5E) 的 算法 就 成 为 一 个 简单 的 
问题 了 。 但 在 开始 分 析 之 前 我 们 先 来 证 明 一 个 重要 的 引 理 。 

引 理 27.19 设 G=(V，B) 是 源 为 s、 汇 为 上 t 的 一 个 流 网 络 ， 上 且 T 是 G 的 先 流 。 则 对 任 
意 涂 出 结 点 au， 在 残留 网 络 G 中 存在 一 条 从 到 s 的 简单 路 径 。 

证 明 : 设 U = {u: 台 , 中 存在 一 条 从 2 到， 的 简单 路 径 }， 且 为 了 引 人 了 矛盾 假定 s#U。 
设 U =V 一 U。 

我 们 认为 对 于 每 对 缚 点 YEU，wEU，flw，w) 和 0。 为 什么 ?2 如果 fw，w> 0， 
则 ffv，w) < 0。 这 说 明 有 ci(v， 由 一 cfv， 四 一 ffv， 几 > 0。 因 此 存在 一 条 边 (v，wEE，， 
因而 G, 中 必 有 一 条 形 如 u vv 一 w 的 简单 路 径 ， 这 与 我 们 对 w 的 选择 相 矛 盾 ， 


因此 , 必 有 fU，U) 乏 0， 这 是 由 于 在 这 一 隐 含 的 求 和 式 中 的 每 一 项 都 为 非 正 值 。 根 据 
等 式 (27.8) 和 引 理 27.1， 可 以 得 出 结论 : 
etU) 王八 V，U) 
=fU，U) +RU，U) 
一 KU，U) 
0 
对 所 有 属于 V-is} 的 结 点 其 余 流 为 非 负 ; 因为 我 们 假定 USEV-{s}+， 因 此 对 所 有 结 点 uEU 
必 有 et(w=0， 特 别 地 ,e(u= 0， 这 与 我 们 假定 习 基 溢出 结 点 相 了 矛盾 。( 证 毕 ) 
下 列 引 理 给 出 了 结 点 高 度 的 限制 范围 ， 其 推论 给 出 了 执行 的 全 部 提升 操作 的 次 数 的 限制 
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范围 。 

引 理 27.20 设 G=(V、E) 是 一 个 流 网 络 ， 其 源 为 s 汇 为 1 GENERIC- 
PREFLOW-PUSH 对 局 执行 中 的 任何 时 刻 对 所 有 结 点 ac V， 有 hit 所 2|V| 一 1， 

证 明 : 因为 由 定 广 源 s 和 汇 t 均 不 是 溢出 结 点 ， 所 以 他 们 的 总 度 不 会 改 税 。 因 此 我 们 总 
是 有 hfs]=|V| 和 ht]=M 

因为 只 有 当 某 结 点 为 溢出 时 它 才 会 被 提升 ， 所 以 我 们 来 考察 作 意 洪 出 缚 点 ul V-fs: 
红 ， 引 理 27.19 告诉 我 们 ,Gr 中 存在 -一 条 从 到 ss 的 简单 路 从 Pp，。 设 p= <vo，VwW，…， 
V>， 其 中 wmw=u，w=s， 并 且 机 于 pp 是 简单 路 和 从， 所 以 下 委 |VI-i 对 0，1，… 
-1 有 (vv Er 机 此 仙 吉 再 27.16 可 得 hfvj 乏 hf[v Frl1， 在 路 径 p 上 把 这 些 不 等 式 自 
开 可 得 hj= htvyj 乏 hfvjHks 和 BTSHHIVFTD=2VI--1。 

推论 27.21( 关 于 提升 操作 的 限制 范围 ) 设 扣 =(V，E) 生 一 个 流 园 络 ， 其 源 为 sS， 汇 为 - 
t， 在 GENERIC-PREFLOW~-PUSH 对 避 的 执行 过 程 虫 ， 对 每 个 结 点 执行 提升 操作 的 次 
数 至 多 为 3V|-1， 全 部 提升 操作 执行 次 数 鞋 多 为 2IVi-DUVI-2<2V 

证 朋 : 只 有 间 上 上 V-A， 电 中 的 |WI -2 个 结 点 可 能 被 提升 。 设 u: V-5，4 贡 操作 
LEFT 增加 了 hfu] 的 值 ，htu] 的 初始 值 基 0， 并 失 直 二 理 27.10 可 知 其 值 不 超过 24VI!， 因 
此 ， 每 个 结 点 u，、V-{s， 吓 革 多 被 提升 3VI1 次 ， 所 执行 的 全 部 提升 操作 次 数 因 抽 为 
(YI-DUVi2)》<2V。 

引 理 27.20 也 有 有 劲 于 限制 您 和 推进 的 次 数 。 

引 理 27.22( 关 于 饱和 推进 的 限制 范围 ) 在 GENERIC-PREFLOW-PUSH 对 任意 流 网 
络 台 =(V，E) 的 执行 过 程 中 ， 愧 和 推进 的 次 数 至 多 为 3VIEI|。 

证 有 明 : 对 任意 一 对 铺 点 u，vfK V， 考 察 以 唱 到 v 和 从 v 到 的 饱和 和 推进， 如果 存在 任 
何 这 样 的 推进 ， 则 人 u，v 和 (tv， 册 中 侍 少 有 一 条 边 属 于 上。 现在， 假定 发 生 了 从 下 到 v 的 侈 
和 推进 。 为 使 以 后 产 牛 从 到 v 的 另 一 次 推进 ， 算 法 必须 首先 将 流失 v 推进 到 u， 俱 外 到 
hiv] 至 少 增加 2 这 一 情况 才 会 发 生 。 同 样 ， 在 从 习 到 v 的 两 次 饱和 推进 之 间 ，h[d 必 须 双 少 
增加 2. 

对 由 现在 结 点 u 和 vv 之 间 的 每 次 饱 推进 ， 考 察 由 h[u]+hEv] 给 出 的 -个 整数 序列 A。 我 
们 希望 得 到 这 -- 序 列 长 度 的 限制 范围 。、 当 u 和 Yv 之 间 前 任何 -- 个 方向 上 发 后 第 一 典 推 进 
上 时， 我们 必须 有 hluj+thtv]> 1 因此， 天 中 的 第 1 个 整数 坚 少 为 1， 

- 当 有 最 后 -- 次 像 这 样 的 推进 发 生 时 ， 由 引 理 20.20 可 得 芽 可 +hlvy 大 
.VDH3IVI- 人 =4VI-3 所 以 序列 A 中 的 最 后 一 个 整数 最 大 为 4VIF3。 根 据 上 一 段 中 的 
论断 ， 序 询 A 中 的 整数 间 笠 少 相 隔 二 因此 A 中 整数 的 个 数 宇 多 为 
(4IVI-3D7 32+i=2VI-L (加 1 是 为 了 保证 序列 的 两 头 都 被 计算 在 内 )。 因 此 ， 绊 点 和 
结 点 v 之 问 的 饱和 操作 的 全 部 次 数 至 多 为 23|Vl-1。 再 用 它 科 以 边 的 数目 就 得 到 饱 扒 进 的 全 
部 次 数 至 多 为 : (2IVIFDIEI< 导 VE 《证 毕 ) 

下 列 引 理 给 出 子 一般 性 先 流 推进 算法 中 不 饱和 推进 次 数 的 限制 荡 盾 。 

引 理 27.23( 关 于 不 饱和 推进 的 限制 范围 ) 在 GENERIC-PREFLOW--PUSH 对 任意 沉 
网 络 G= (V，E) 的 执行 过 程 中 ， 不 饱和 推进 的 次 数 至 多 为 : 4IVFOUVI+IE|)。 

证 明 : 定义 一 个 势 函 数 中 = 和 xh[v]， 其 中 居 EV 是 谥 出 结 点 的 集合 。 开 始 时 ， 
电 =0， 注 意 : 琨 升 :个 结 点 时 中 译 多 增加 2VI， 这 是 因为 求 和 所 依赖 的 集合 是 相同 的 ， 
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并 且 不 能 裤 提 升 到 超过 其 可 能 的 最 大 高 度 ( 由 引 理 27.20 可 知 ， 该 商 度 至 多 为 2V|)， 回 
样 ， 从 结 点 u 到 结 点 y 的 饱和 推进 至 多 使 中 增加 ?|VYI， 这 是 因为 高 度 没有 变化 ， 并 且 只 有 
其 腐 度 至 多 为 2VI 的 结 点 v 可 有 能 成 为 汶 出 结 点 。 最 后 广 意 ， 从 于 到 v 的 不 饱和 推进 至 少 使 中 
减少 1， 这 是 由 于 经 推进 以 后 不 再 是 谥 出 结 点 ， 而 Y 在 此 后 成 为 洲 出 结 点 (即使 它 事先 不 是 )， 
hfvj_hIa= 一 一 |。 

因此， 在 算法 的 执行 过 程 中 ， 由 于 有 推论 27.21 和 引 理 27.22 的 限制 ， 中 的 全 部 增加 量 
至 多 为 CJVIKVPH2IVPC2lvilED=4IVPOvHHIS)。 由 于 中 庆 0， 所 以 全 部 揭 减 小 量 ， 即 非 饱和 
推进 的 全 部 执行 次 数 至 多 为 4 VIMgVI+HIED。( 证 毕 ) 

现在 我 们 已 经 为 地面 分 析 GENERIC-PREFLOW-PUSH 过 程 以 及 基于 先 流 推 进 方 法 
基础 之 上 的 代 何 算法 作 好 了 充分 准备 。 

定理 27.24 在 GENERIC-PREFLOW-~-PUSH 对 任意 流 网 络 如 =(V，BE) 的 执行 过 程 
中 ， 基 本 操作 的 执行 次 数 为 O(V“E)。 证 明 : 从 推论 27.21 和 引 理 27.22 以 及 27.23 立即 可 
得 . -。 

推论 27.25 对 任意 流 网 络 G =(V. B 巧 ， 存 在 一 种 先 流 推进 算法 的 实现 ， 其 运行 时 间 为 
OCV2E)。 

证 明 : 练习 27.4-1 要 求 说 明 如 何 实现 一 般 性 算法 ， 使 其 开销 为 : 每 个 提升 操作 运行 时 
问 为 OILV), 乌 个 推进 操作 为 QUD)。 和 由 此 可 知 椎 论 成 立 。 


* 27.5 ”向 前 提升 算法 


先 流 推进 方法 允许 我 们 以 任意 次 序 运用 基本 操作 。 但 是 ， 通 过 仔细 选择 执行 次 序 和 有 效 
安排 网 络 的 数据 结构 ， 可 以 用 比 推 论 27.25 给 出 的 DO(V2B) 更 少 的 运行 时 间 解 决 最 大 流 问 
题 。 我们 现在 来 研究 向 前 提升 (lift-to front} 算 法 ， 这 是 一 种 运行 时 间 为 DO(V“ ) 的 先 流 推进 竺 
法 。 从 产 近 意义 上 来 看 ， 它 至 少 不 霸 于 O(VE)。 

回 前 提升 算法 设置 了 一 张 网 络 中 的 结 点 表 。 算法 从 表 的 前 端 开始 扫描 该 表 反复 选 出 谥 
出 结 与 u 然后 “ 赤 放 " 它 ， 即 反复 执行 推进 和 提升 操作 直至 铺 点 u 不 再 存在 正 的 余 流 。 当 某 
个 结 点 被 提升 时 ， 它 就 被 移 到 表 的 前 端 (所 以 算法 名 为 lift-te front 向 前 握 升 } 算法 多 重新 开 
始 始 扫 措 。 

问 前 提升 算法 的 正确 性 及 其 性 能 分 析 与 概念 “容许 * 边 有 关 : 即 残留 网 络 中 推进 的 流 经 过 
的 那些 边 。 在 证 明 儿 条 关于 容许 网 络 的 性 质 后 ， 我 们 将 讨论 释放 操作 ， 最 后 给 出 并 分 析 疝 前 
提升 算法 。… 


容许 边 和 容许 网 络 


设 台 =(V，B) 是 一 个 流 网 络 ， 其 源 为 s， 汇 为 tf 是 后 的 流 , h 是 剖 度 随 数 ， 则 如 果 
cdu，W>0 昌 hu=hvt+tl， 就 说 人 0， 宙 是 容许 边 。 和 否则 ，(a， 纪 是 非 容许 边 。 容 许 网 络 为 
Gra=(V，Eiu， 其 中 El，h 为 容许 边 的 集合 。 

容许 网 络 是 由 能 被 推进 的 流 所 通过 的 那些 所 组 成 。 下 列 引 理 说 明 这 种 网 络 是 一 个 有 阅 
无 回路 图 (dagj)。 

引 理 27.26 (容许 网 络 中 不 包含 贺 路 ) 如 果 台 =(V，B) 是 一 个 流 网 络 , 了 是 所 的 一 个 先 
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流 ， 且 h 是 马上 的 高 度 函 数 , 则 容许 网 络 Gi= (V，Ei 不 包含 回路 。 

证 明 : 我 们 通过 引信 了 刻 盾 来 证 明 该 引 理 。 银 定 Ghm 包 人 洛 一 则 路 p= <v，VW，…，wW>， 
其 中 ve=v， 且 k>0。 由 于 p 中 的 每 条 边 均 为 容许 边 ， 所 以 对 i=1，2，…Kk， 有 
htv-D= htvi+1， 对 这 些 等 式 沿 周 路 求 和 ， 得 


2htv 一 2 (hv + 1 


-ZhewD+x 


因为 回路 p 中 的 每 个 结 点 在 每 个 求 和 式 中 仅 出 现 一 次 ， 由 此 推 得 0=k， 与 假设 矛盾 。 

下 面 两 条 引 理 说 明 执 行 推进 和 提升 操作 对 容许 网 络 的 影响 。 

引 理 27.27 设 怠 =(V，E) 是 一 个 流 网 络 , 上 是 G 的 一 个 先 流 ， 且 hh 是 各 上 的 高 度 函 
数 。 如 果 结 点 习 是 溢出 结 点 且 (u， 人 如 是 容许 边 ， 则 可 采用 PUSH(u，v)。 该 操作 不 会 建立 任 
何 新 的 容许 边 ， 但 它 可 能 使 u，W) 变 为 非 容许 边 。 

证 明 : 根据 容许 边 的 定义 可 知 能 够 把 流 从 u 推进 到 v。 由 于 u 是 复出 结 点 ， 所 以 操作 
PUSHtu，vY) 适 用 。 把 流 从 推进 到 v 这 一 操作 唯一 可 能 建立 的 新 的 残留 迪 是 边 (u，v)}。 但 
由 于 h(w= htu)!1， 所 以 边 (u，W 不 可 能 变 成 容许 边 。 如 果 该 操作 是 饱和 推进 ， 则 操作 执行 
后 cku，V=0 且 ( 人 ， 岂 成 为 非 容 许 边 。( 证 毕 ) 

引 理 27.28 设 G=(V，B) 是 一 个 流 网 络 ，f 是 G 的 一 个 先 流 ， 且 h 是 马上 的 高 度 函 
数 ， 如 果 结 点 起 溢 出 结 点 并 且 不 存在 离开 的 容许 边 ， 则 此 时 LIFT(u) 适 用 。 在 执行 提升 
操作 后 ， 盏 少 存在 一 条 离开 的 容许 边 ， 但 不 会 有 进 人 习 的 容许 边 。 

证 明 : 如 果 了 是 溢出 结 点 ， 则 由 引 理 27.14 可 知 要 么 有 推进 操作 ， 要 么 有 容许 操作 适用 
于 该 结 总 。 如 果 不 存 在 离开 的 容许 边 ， 就 不 可 能 有 从 aa 出 发 向 前 推进 的 流 ， 因 此 此 时 
LIFT(0O 适 用 ， 在 提升 操作 后 ，h[u = 1+min{fhfv]: 各，vwEE}+。 关 此 ， 如 果 v 是 集合 中 满 
足 最 小 值 的 结 点 ， 则 边 (a， 允 成 为 容许 边 。 这 样 ， 在 提升 操作 后 ， 至 少 存 在 一 条 离开 的 容 
许 边 。 

为 了 证 明 在 提升 操作 后 ， 不 会 有 进 人 au 的 容许 边 ， 我 们 人 恨 定 存在 一 结 点 v， 使 得 (0，Yv) 
为 容许 边 。 那 么 在 执行 提升 操作 后 ，h[y]= hlul+1。 所 以 在 提升 前 有 h[v]> h[ul+1。 但 根据 引 
理 27.13， 可 知 在 高 度 善 大 于 1 的 两 个 结 点 间 不 可 能 存在 残留 边 ， 此 外 ， 提 升 某 结 点 并 不 会 
政变 残留 网 络 。 琴 此 ，(u，v) 不 属于 残留 网 络 ， 因 而 它 也 不 可 能 属于 容许 网 络 。( 证 毕 ) 


相 邻 表 


向 前 提升 算法 中 的 边 都 被 族人 “ 相 邻 表 * 中 。 如 果 给 定 一 流 网 络 台 =(V，E)， 对 结 点 ut 
V， 其 由 邻 表 N[J 是 一 个 关于 台中 的 相 邻 结 点 的 单 链 表 。 因 此 ， 如 果 (u，VvEE 或 (v， 
“于 、 则 结扎 v 出 现在 表 N[ 可 中 。 相 邻 表 NI 仅仅 包含 那些 可 能 存在 残留 边 (， 妇 的 结 点 
v。N[uj 中 的 第 一 个 结 点 由 head[N[u] 指 出 相 邻 表 中 ”的 下 一 个 结 点 由 指针 
next 一 neighbor[vj 指 出 ， 如 采 v 蚌 相 邻 表 中 的 量 后 一 个 结 点 ， 则 该 指针 为 空 。 

向 前 提升 算法 在 其 执行 过 程 中 按 某 确定 的 顺序 包 环 访问 每 个 相 邻 表 。 对 每 个 结 点 u， 域 
current[ 可 指向 Nu 中 当前 被 考察 的 缚 点 。current[u] 开 始 时 被 置 为 head[N[u]。 
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溢出 结 点 的 释放 


一 个 装 出 铺 点 习 通 过 下 列 方 式 释放 : 把 该 结 点 的 所 有 余 流 通过 容许 边 推 进 到 相 邻 结 
点 ， 必 雪 财 提升 结 点 a 以 使 得 离开 的 边 变 成 容许 边 。 代 码 如 下 : 


DiSC 肌 和 及 如 EL) 
1 while efu] > 站 
2 dove<currenttu] 
flv 王 MIL 
then LIETOU] 
currentfu]-bheadfN[ul 
elseif cfu，vJ) > 人 and hfu= hfvi+i 
tbhen PUSHIu， 
else Cuftent [wu]- next 一 neighhor[v] 


加 -] 人 th 和 


图 27.10 描述 了 第 1-8 行 while 循环 中 的 几 次 闪 代 。 只 要 v 还 有 正 的 余 流 ， 循 环 将 一 直 
进行 下 去 ， 每 次 迁 代 中 根据 相 邻 表 Nu 中 的 当前 结 点 Y 的 情况 选 择 三 个 操作 中 的 一 个 加 以 
执行 。 
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图 27.10 钴 点 的 释放 过 程 
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图 27.10 绪 氮 的 释放 过 程 ( 续 ) 


1. 刘 果 v 为 NIL， 说 明 运 行 到 了 Ntu] 的 末 结 点 。 第 4 行 提升 结 点 u， 第 5 行 把 wu 的 当前 
锅 接 点 复位 为 NI 中 的 第 一 个 结 点 ( 引 理 27.29 将 说 明 提 升 操作 适用 于 这 种 情况 )。 

2. 如 果 v 木 是 NLL 且 人 ， 妇 是 一 条 容许 边 (由 第 6 行 中 的 测试 所 决定 ) 册 第 了 行 把 u 的 
一 些 (也 可 能 是 全 部 ) 余 流 推 进 到 结 点 v， 

3. 如 果 v 不 是 NIL 且 (au， 中 是 非 容许 边 。 则 第 8 行使 current [ul 在 相 邻 表 中 向 前 推进 一 
个 结 点 。 

注意 ， 奶 果 对 一 个 溢出 结 点 咽 调 用 DISCHARGE， 则 由 DISCHARGE 执行 的 最 后 一 
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个 操作 几 定 是 从 出 发 的 一 个 推进 操作 。 为 什么 昵 ?因为 只 有 当 efu] 变 为 0 时 算法 才 会 终 
生 ， 而 提升 操作 和 推进 指针 current [由 都 不 会 影响 efu] 的 值 。 

我 们 必须 保证 当 DISCHARGE 调用 PUSH 或 LIFT 时 ， 相应 的 操作 应 该 送 用。 下 面 
的 疆 理 证 明了 这 一 事实 。 

引 理 27.29 如 果 DISCHARGE 在 第 7 行 中 调用 PUSH(a，vY)， 则 此 时 推进 操作 适用 
于 (nu，VwW。 如 果 DISCHARGE 在 第 4 行 中 调用 LIFT(o),。 则 此 时 提升 操作 适用 于 结 点 u。 

证 明 : 第 1 行 和 第 6 行 中 的 测试 保证 了 仅 在 推进 操作 适用 本 会 发 生 推进 操作 ， 这 样 我 
们 就 证 明了 引 理 的 第 一 个 结论 

为 了 证 明 第 二 个 结论 ， 根 据 第 1 行 中 的 测试 和 引 理 27.28， 我 们 仅 需 要 证 明 所 有 次 并 
的 边 为 非 容许 边 。 注意 ， 当 反复 调用 DISCHARGE(mD 时 ， 指 针 current[J 沿 表 NEuo] 窗 前 移 
动 。 每 一 " 趟 "开始 于 N[u] 的 头 并 在 currenthj= NIL 时 结束 ， 这 时 被 提升 ， 然 后 又 开始 新 
的 一 趟 拉 描 。 在 某 趟 中 当 指 针 current[ 由 经 过 一 结 点 YE Nd 时 ， 由 第 6 行 中 的 铀 试 可 知 边 
tu，v) 一 定 被 看 作 非 容许 边 。 因 此 在 该 趟 扫 措 完成 时 、 每 条 离开 的 边 都 在 该 趟 中 某 个 时 刻 
钙 确 定 为 非 容许 边 。 最 关键 的 是 ， 在 该 未 结束 时 ， 每 条 边 离 开 u 的 边 依 然 是 非 容许 边 。 为 
什么 呢 ? 因 为 由 引 理 27.27， 推 进 操 作 不 会 建立 任何 容许 边 ， 当 然 也 就 不 会 建立 任何 离开 结 点 
ua 的 边 。 凡 此 ， 任 何 容许 边 都 必定 是 出 提升 操作 建立 的 。 但 是 在 该 趟 中 结 点 下 并 没有 被 提 
升 ， 并 且 由 引 理 27.28 可 知 ， 在 该 不 中 被 提升 的 任何 其 他 结 点 都 没有 进 人 该 结 点 的 容许 边 。 
因此 ， 在 该 趟 结束 时 ， 所 有 离开 的 边 依然 为 非 容许 边 、 定 理 得 证 。{ 证 毕 ) 


向 前 提升 算法 


在 向 前 提升 算法 中 ， 我 们 设置 了 包 洁 V-{s， 甘 中 所 有 娃 点 的 链表 工 ， 该 链表 的 一 个 重 
要 性 质 是 我 们 根据 容许 网 络 对 表 中 的 所 有 结 点 进行 了 拓扑 排 序 ( 回 忆 引 理 27.26 巴 证 明 容 许 
网 络 是 一 个 有 阿 无 回路 图 dag)， 

下 面 的 算法 假定 对 每 个 结 点 u 已 经 建立 了 相 邻 表 Nfu], 并 假定 next[a] 指 向 工 中 心 的 后 
继 结 点 。 若 u 是 表 中 的 最 后 一 个 结 点 ， 则 nexttu]= NTIL.。 


ELIFT-TO-FERONTI(G，s， 妇 
INIIIAEIZE 一 PREFLOVWIG， 引 
EL<-V[G]- 人 ，t 《以 任意 顺序 排列 ) 
for 每 个 结 点 ut V[IGHFT1S， 寺 
do current[ul= head[N[Iu]] 
= -head[L] 
whije mLIL 
b ed 一 height< 一 hru] 
DISCHRGEID) 
记 h[u] > old 一 height 
then 把 移 到 表 世 的 前 疯 


， Unextru] 
向 前 提升 算法 执行 如 下 ， 第 1 行 把 先 流 和 高 度 初 始 化 为 与 一 般 性 先 流 推 进 算法 相同 的 


值 ， 第 2 行 对 表 L 进行 初始 化 使 其 包 会所 有 潜在 的 溢出 结 点 (以 任何 顺序 排序 )。 第 3-4 行 对 
每 个 结 点 的 current 指针 进行 初始 化 使 其 指向 的 相 邻 表 中 的 第 一 个 结 点 。 


一 辫 拓 对 hi 二 
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如 图 27.11 所 示 ， 第 611 行 的 while 循环 对 表 工 进行 打 描 并 同时 释放 缚 点 。 第 5 行使 
扫 撒 从 表 中 第 一 个 结 点 开始 .每 次 通过 循环 时 ， 在 第 8 行 中 的 一 个 结 点 u 被 释放 。 如 果 mu 
由 过 程 DISCHARGE 提升 ， 第 10 行 就 把 它 移 到 表 工 的 前 端 。 我 们 在 释放 操作 执行 之 前 先 
把 结 点 u 的 高 度 存 人 变量 old-height 中 (第 7 行 ) 并 把 它 与 执行 释放 操作 以 后 的 u 的 两 度 进行 
比较 ， 遂 过 这 种 方法 来 决定 是 否 执行 第 10 行 的 操作 。 第 11 行使 得 while 敌 环 的 下 一 次 迭 伐 
使 用 表 工 中 心 的 后 继 结 点 。 如 果 _u 被 移 到 表 的 前 端 ， 则 下 一 次 迭代 中 使 用 的 结 点 为 的 处 
于 表 中 新 的 位 置 的 后 继 结 点 。 

为 了 证 明 LIFT-TO-FRONT 计算 出 一 个 最 大 流 ， 我 们 先 证 明 它 是 一 般 先 流 推进 算法 
的 一 种 实现 首先， 注意 该 算法 仅 在 推进 或 提升 操作 适用 时 才 执 行 相应 的 操作 ， 这 是 因为 引 
理 27.29 保证 了 DISCHARGE 仅 在 某 种 操作 适用 时 才 会 执行 该 操作 。 当 
LIFT-TO-FRONT 终止 时 ， 不 再 有 基本 操作 适用 。 需 要 注意 的 是 ， 如 果 到 达 L 的 末 
端 ，L 中 的 每 个 结 点 必 征 都 被 释放 且 没 有 引起 提升 操作 。 我 们 待 会 儿 将 要 证 明 的 引 理 27.30 
说 明 表 上 是 容许 网 络 的 一 个 拓扑 序列 。 所 以 ， 推 进 操作 使 余 流溢 表 流 向 下 面 的 铺 点 (或 流向 
5 或 ti 因此， 如 果 指 针 到 达 表 的 末 居 ， 则 每 个 结 点 的 祭 流 为 0， 因而 无 基本 操作 适用 。 
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图 27.11 LIFT-TO-FRONT 的 操作 步 又 
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图 27.11 LIFT-TO-FROMNT 的 操作 步 双 ( 续 ) 


引 理 27.30 如 宁 我 们 对 谣 为 s 汇 为 上 的 流 网 络 G=(V，B) 运 行 过 程 
LIFT-TO-FRONT， 则 第 611 行 while 循环 的 每 次 选 代 维持 下 列 条 件 不 变 : 表 工 是 容许 
网 络 Grs= (V，Ery) 中 的 结 点 的 一 个 拓扑 序列 。 

证 明 : INITIALIZE-PREFLOW 运行 结束 后 ，jfls]=|VI 且 对 所 有 vE V-fsj，h[v] = 0。 
册 于 IV| 兰 尺 它 至 少 包 含 s 和 绅 ， 所 以 不 可 能 存在 容许 边 。 因 此 BE = 有 下，V-{s， 匡 中 的 任意 
顺序 结 点 列 为 Gy 的 拓扑 序列 。 

我 们 现在 证 明 while 循环 的 每 次 欠 代 都 能 保持 这 一 性 质 不 变 。 容 许 网 络 仅 能 被 推进 和 提 
升 操作 所 改变 。 由 引 理 27.27， 推 进 操作 只 能 使 边 变 为 非 容许 边 。 因此 只 有 提升 操作 才能 建 
立 容 许 边 。 但 是 当 一 个 结 点 被 提升 后 ， 根 据 引 理 27.28 可 知 不 存在 进 人 早点 岂 的 容许 边 ， 但 
可 能 存在 离开 的 容许 边 . 因此 ， 通 过 把 u 移 到 的 前 端 ， 算 法 可 以 保证 任何 离开 的 容 
许 边 满 足 拓 扑 排序 的 朗 求 。{ 证 毕 ) 


算法 分 析 


我 们 现在 来 证 明 对 任意 流 网 络 G=(V，BDHE)， 过 程 LIFT-TO-FERONT 的 运行 时 间 为 
OV ). 因为 该 算法 是 一 般 性 先 流 推进 方法 的 一 种 实现 ， 所 以 可 以 利用 推论 27.21， 该 推论 
对 每 个 结 点 执行 的 提升 操作 次 数 给 出 了 DIV) 的 范围 限制 ， 并 对 全 部 提升 换 作 的 执行 次 数 给 
出 了 QO(V 的 范围 限制 。 此 外 ， 练 习 27.4 一 2 中 给 出 了 提升 操作 所 耗费 的 运行 时 间 DO(V)， 引 
理 27.22 也 对 饱 推进 操作 的 全 部 执行 次 数 给 出 了 O(VE) 的 限制 范围 。 

定理 27.31 LIFT-TO-FRONT 对 任意 流 网 络 G=(V，B 的 运行 时 间 为 DIV3)， 
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证 明 : 让 我 们 考察 向 前 握 升 算法 的 一 个 “阶段 *，、 即 其 两 次 连续 提升 换 作 之 间 的 时 间 段 . 
再 于 存在 DOV3 次 提升 操作 ， 所 以 算法 有 O(V3 个 阶段 。 每 个 阶段 至 多 包 售 |V| 次 对 
DISCHARGE 的 调用 ， 这 一 点 从 以 下 陈述 中 可 以 看 出 。 刀 果 DISCHARGE 没有 执行 提升 
操作 ， 则 对 DISCHARGE 的 下 次 调用 属于 不 同 的 前段 。 因 为 每 个 阶 侦 至 多 包含 |VI 次 对 
DISCHARGE 的 调用 并 且 有 QOV9? 个 阶段 ， 所 .以 LIFT-TO-~FRONT 第 8 行 对 
DISCHARGE 调用 的 次 数 为 O(V3。 因 而 ，LIFT-TO-FRONT 的 while 循环 所 完成 的 全 
部 工作 (不 包含 在 DISCHARGE 内 部 所 执行 的 操作 ), 至 多 为 O(V3。 

现在 我 们 必须 对 算法 执行 中 在 DISCHARGE 内 部 完成 的 工作 给 出 一 个 限制 范围 。 在 
DISCHARGE 内 部 的 wiile 循环 的 每 次 选 代 执行 三 种 操作 中 的 一 种 。 我 们 将 对 热 行 每 一 种 
操作 所 包含 的 全 部 工作 量 进 行 分 析 。 

我 们 首先 来 看 看 提升 操作 (第 4-5 行 )。 案 习 27.4 一 2 对 执行 的 全 部 Of(V?) 次 提升 操作 给 由 
一 个 OKVB) 的 时 间 范 国 限 制 。 

现在 ， 我 们 考虑 在 第 8 行 中 对 指针 current[ 宫 进行 更 新 的 操作 ， 每 次 当 结 点 u 被 提升 

这 一 操作 出 现 Oldegreefa) 次 ， 并 且 对 于 该 结 点 总 共 出 现 该 操作 O(V.degree(uj) 次 。、 因 
此 ， 对 所 有 结 点 ， 巾 握手 引 理 (练习 54-] 可知 ， 在 相 邻 表 中 推进 指针 所 完成 的 全 部 工作 量 
为 DIVE)， 

DISCHARGE 完成 的 第 三 种 类 型 的 操作 是 推进 操作 (第 7 行 )。 我 们 已 经 知道 饱和 推进 
操作 的 全 部 执行 次 数 为 D(VE)。 注 意 ， 如 果 我 们 执行 不 饱和 推进 操作 ， 则 下 于 该 推进 操作 
使 余 流 变 为 0， 所 以 DISCHARGE 立即 返回 。 因 此 ， 每 次 对 DISCHARGE 的 调用 中 至 多 
有 -次 不 饱和 推进 操作 。 正 如 我 们 已 经 注意 到 的 ，DISCHARGE 被 调用 O(V3 次 ， 因 此 执 
行 帮 饱和 推进 所 锣 要 的 全 部 运行 时 间 为 DIV 

因此 ，LIFT-TO-FRONT 的 运行 时 间 为 O(V2HVE)= O(V3).。( 证 毕 ) 


思 考 题 


27-1 渤 脱 问题 


一 个 nxa 格 概 是 由 mn 行 和 n 列 结 点 组 成 的 一 个 无 向 图 ， 如 图 27.12 所 示 ({ 开 始点 为 黑色 
.其 他 均 为 旧 色 )。 用 (人 j) 表 示 处 于 第 i 行 第 j 列 的 结 点 。 除 了 边界 结 点 ( 即 满足 i= 1，i=m， 
i= 1 或 j 一 的 结 点 G， 坊 ， 格 春 中 的 所 有 其 他 结 点 部 有 四 个 相 分 结 点， 

给 定格 棚 中 的 mm<m 个 起 始 结 点 (xl，y0，(xo，y，…，(es。， 和 )， 和 逃脱 问题 即 确定 从 
已 失 缚 点 到 边界 上 的 任何 四 个 相 异 的 结 点 间 是 否 存 在 mm 条 其 结 点 不 相交 的 路 径 。 例 如 ， 图 
>7la>t 中 的 格 稠 包含 一 个 逃脱 ， 面 图 27.12(D) 中 的 格 权 中 没有 远 脱 ， 

a. 沽 察 一 个 结 点 和 边 都 具有 容量 的 流 网 络 。 这 就 是 说 ， 进 入 某 指定 结 点 的 正 网 络 流 受 
到 一定 的 容量 限制 。 证 明 : 在 边 和 结 点 具有 容量 的 网 络 中 确定 最 大 流 的 问题 可 以 转化 为 类 似 
规划 的 流 网 络 中 的 普通 最 大 流 问题 。 

b. 描述 一 种 有 效 的 算法 以 解决 逃脱 问题 ， 并 分 析 其 运行 时 间 。 
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图 27.12 ”关于 让 脱 问题 的 图 


27-2 最 小 路 径 萎 盖 


有 向 国 怠 =(V， 忆 的 一 个 路 径 覆 盖 是 一 个 其 结 点 不 相 兖 的 路 径 的 集合 bp， 满 足 V 中 的 
每 一 个 结 点 仅 分 别 包 含 于 p 中 的 一 条 路 径 。 路 径 可 以 从 任意 结 点 开始 和 结束 ， 且 长 度 也 为 
任意 值 ， 包 括 0。 台 的 一 个 最 小 路 径 丁 盖 是 指 包含 尽 可 能 少 的 路 径 的 路 径 驯 盖 。 

a. 写 出 一 有 效 算法 以 找 出 有 向 无 回路 图 台 = (VY，HE) 的 一 个 最 小 路 径 覆 瘟 ( 提 示 : 假设 
VY=11，2，…， 吕 ,构造 图 G =(V ，BE)， 其 中 ， 


一 1xo， 党 1 xn 站 用 yo， 了 1 了 2 “1 7 中 
BE { 0xo， X 让 1 区 V 放 HG， yo i 芍 V} Utx， yi 全 ， < E|} 
然后 对 其 运行 最 大 流 算法 ). 


b. 所 给 的 算法 是 否 适 用 于 包含 回路 的 有 向 图 ? 试 作 说 明 . 
27-3 航天 飞机 实验 


NASA 正在 为 航天 飞机 计划 一 系列 的 太空 飞行 ， 在 每 次 飞行 中 必须 决定 进行 何 种 商业 
性 实验 和 配 载 何 种 仪器 设备 ，Spock 教授 正在 研究 这 一 问题 。 对 每 次 飞行 ，NASA 考察 一 
个 实验 集合 = tE，E2，…， 了 PE， 实验 了 的 商业 园 助 人 已 同意 为 该 实验 的 结果 向 NASA 
支付 p 美元 。 实 验 使 用 的 全 部 仪器 为 集合 I= 册 ，L，…，5} 每 个 实验 所 融 要 用 到 的 仪器 
为 子 集 RiSI。 运 送 仪 器 节 的 费用 为 忌 美 元 。 教 授 的 任务 就 是 找 出 一 个 有 效 算法 ,确定 在 某 
一 次 指定 飞行 中 要 进行 哪些 实验 并 运送 哪些 仪器 才能 使 净 收 益 最 大 、 净 收益 指 进行 实验 所 获 
得 的 全 部 收 和 人 与 运送 仪 回 的 全 部 费用 的 差额 。 

考察 下 面 的 网 络 台 。 网 络 包 含 一 个 源 结 点 s， 结 点 荆 ，LD，…， 工 ， 缚 点 卫 ，E，… 
E。 和 一 个 汇 结 点 t， 对 = 1，2，…，n， 存 在 一 条 容量 为 避 的 边 人 ，E), 且 对 j=1，2 
…， 了 im， 存在 一 条 容量 为 让 的 边 ( 丁 ， 日 。 对 丰 = 1，2，…，0m 和 j=1，2，…,i， 如 果 琅 6 
负 ， 则 存在 一 条 有 限 容 量 的 边 ([， 瑟 )。 

a. 证 明 : 对 G 的 一 个 有 限 容 量 的 割 (S，T)， 如 果 也 ET， 则 对 每 个 长 ER 有 玉 ET。 

b. 证 明 ，G 的 最 小 者 的 容量 就 是 最 大 净 收 益 。 


c. 给 出 一 有 效 竺 法 以 确定 应 该 进行 哪些 实验 和 运送 娜 些 仪器 。 使 用 mma 和 T= Z-， Ri 
来 分 析 算 法 的 运行 时 间 。 


27-4 最 大 流 的 更 新 


设 G=(V，BE) 是 源 为 S， 汇 为 + 并 且 具 有 整数 容量 的 一 个 流 网 络 。 恨 定 已 知 G 中 的 一 个 
最 大 流 . 

a. 假 定 把 一 条 边 ，ViCE 的 容量 增加 1。 试 写 出 一 个 运行 时 间 为 DIV+EJ 的 算法 以 更 新 
最 天 流 。 

b. 假 定 把 一 条 边 (a，V EPE 的 容量 减 1。 试 写 出 一 个 运行 时 间 为 O(VA+E) 的 算法 以 更 新 最 
大 流 。 


27-5 用 定 标 法 计算 最 大 流 


设 忆 =(V，B) 是 源 为 s， 汇 为 t+ 并 且 具 有 整数 容量 的 一 个 菠 网 络 。 其 每 条 边 (0， 人 6EEE 
的 容量 cu，VY) 为 整数 。 设 和 = maxu， ucEctu， 由 。 

a. 论 证 各 的 最 小 割 的 容量 至 多 为 CEI. 

b. 证 明 ， 对 一 给 定 的 数 攻 ， 恕 果 存 在 一 条 容量 至 少 为 久 的 增 广 路 径 ， 则 可 以 在 DB) 的 
时 间 内 找 出 该 路 径 。 

下 面 是 对 FORD-EFULKERSON-METHOD 修改 后 的 算法 , 可 以 用 于 计算 忆 的 最 大 
流 . 


MLAX-FELOW--BY-SCALINCGKG，s， 问 
和 +- ctu，Y) 
把 流 了 初始 化 为 0 
优 <.231 语 它 | 
while 改 闻 1 
do whbile 存在 容 硬 至 少 为 区 的 一 条 增 广 路 径 p 
do 沿 P 增 加 流 子 
天 < 有 7 2 
TeEtUTER 于 


6 -| 台 吓 0 


c- 论 证 过 程 MAX-ELOW--BY-SCALING 返回 一 最 大 流 ， 

d. 证 明 ， 每 次 执行 第 4 行 时 ，G 的 最 小 割 的 残留 容量 最 大 为 2 区 全 |. 

e. 论 证 对 每 个 天 的 值 ， 第 $-6 行 的 while 内 循环 将 执行 DIE) 次 。 

f 证 明 ， 可 以 实现 MAX-FLOW-BY-SCALING 过 程 合 其 运行 时 间 为 DO(E%g C)。 


27-6 ”具有 容量 上 限 和 下 上限 的 最 大 流 


假定 流 网 络 各 =(V，B) 中 每 条 边 人 ，v 从 到 v 的 网 络 流 不 仅 有 上 限 cu，v), 而 且 有 下 
限 ba，Y)。 就 是 说 ， 网 络 中 的 任意 流 了 必须 洽 足 : bp(u， 人 妇科 ffu， 人 所 ctu，7。 可 能 发 生 这 
样 的 情况 : 这 样 的 网 络 中 不 存在 容许 流 。 

a. 证 明 : 如 果 f 是 怠 的 流 ， 则 对 G 的 任意 割 ($，.T， 有 上 四 过 cCS，T)b4S，T)。 

b. 设 怠 =({V， E) 是 一 个 流 网 络 ， 其 上 限 函 数 和 下 跟 现 数 分 别 为 c 和 hb，s 和 tt 分 别 是 马 
的 源 和 汇 。 按 如 下 方式 构造 普通 的 流 网 络 台 '=(V' ，E?， 其 上 限 郴 数 为 w， 源 为 s%， 汇 为 
蕊 

V=VUS， 地 
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E'=ELJUs， mm: VEVNLH tb: uEVIULs，b，(t 引 

我 们 按 站 王 方 式 对 边 的 容量 进行 赋值 。 对 每 条 边 人 由，wWKE， 置 cu， 思 =cfuv) 一 bu， 
vY1)。 对 每 个 结 点 ufV， 置 cs ， 册 =bftV， 由 ，eU， 雪 =bfu，VY)， 并 慎 efs， 昌 一 ecft， 
SC。 

.证 明 :， 避 中 在 在 一 容许 流 当 且 仅 当 台中 存在 一 最 大 流 满 足 进 入 汇 才 的 所 有 边 都 是 饱和 
的 . 
d. 给 出 一 有 效 算 法 以 计算 出 具有 上 下 限 的 网 络 中 的 最 大 流 或 确定 该 网络 不 存在 容许 流 。 
分 析 算 法 的 运行 时 间 。 


练习 二 十 七 


27.1-1 在 一 个 流 网 络 中 已 短 结 点 和 v，ctu， 妨 =3，elw，U)=8， 人 假定 从 v 到 习 竺 输 3 个 单位 的 
流 ， 从 v 到 传输 4 个 单位 的 流 。 则 其 下 到 v 的 网 络 流 是 多 少 ? 按 图 27.2 所 示 的 方式 作 图 说 明 。 

27.1-2 试 对 图 27.1b) 所 示 的 访 了 的 三 个 特性 加 以 证 遇 。 

27.1-3 在 多 个 源 和 多 个 汇 的 问题 中 试 对 流 的 定 六 和 特性 进行 扩展 说 明 。 证 明 在 具有 多 个 源 和 多 个 污 
的 营 网 络 中 ， 任 意 流 均 对 应 十 通过 增加 一 个 超级 源 和 超级 汇 所 得 到 的 县 有 相同 值 的 一 个 单 源 单 汇 和 法 ， 挨 之 
亦 然 。 

27.1-4 证 明 引 理 27.1。 

27.1-5 对 二 图 27.1(b) 所 示 的 流 网 络 G=(V， 马 得 流 f， 找 出 两 个 集合 X，YSY， 且 满足 fX， 
TY)=-RV-X，Y)。 再 找 出 两 个 集 台 X，YEY， 且 满足 RX、T) 二 一 RV-X，Y)， 

27.1-6 给 定 一 该 网 结 日 =(Y， 局 ， 设 三 和 五 为 YYxY 到 及 上 的 函数 。 流 的 和 了 交 + 玉 是 从 Yx 交 到 惧 
上 的 力 获 .证 六 如 下 :对 所 有 虽 ，v 专 

(十 PNXu， 宙 一 fu，vHtu，W {27 . 沾 
如 果 有 和 了 司 为 后 的 流 ， 则 + 必 满 足 流 的 三 条 性 质 中 的 哪 一 条 ?又 可 能 汗 反 哪 一 条 ? 

27.1-7 了 7 设 了 为 网 络 中 的 一 个 流 ，* 为 实数 。 标 量 流 之 积 (scalat flow productjaf 是 一 个 人 失 VxYV 到 良 上 

的 困 数 ， 定 多 为 

(af 人 tau， 一 详 全 D， 右 
证 明 如 果 对 和 瑟 是 流 ， 贴 对 断 有 0 入 wz 和 1，oHI-e 生 也 是 流 ， 并 用 该 结论 证 明 网 络 中 的 流 形成 一 个 吓 
集 。 

27.1-8 将 最 天 流 癌 题 表 述 为 一 个 线性 程序 设计 问题 。 

237.1-9 本 节 所 介绍 的 网 络 模 型 支持 一 种 商品 的 流 的 情形 。 多 商品 流 岗 络 可 以 支持 在 p 个 源 结 点 的 集 
合 S= fs，、s，…，sj 和 个 汇 结 点 的 集合 T= ft，b，…， 二 之 间 的 由 P 种 商品 组 成 的 流 。 从 璐 到 v 关 
于 第 工种 商品 的 网 络 六 用 Ru，W 表 示 。 对 第 1 种 商品 来 说 ， 其 唯一 的 源 为 % 旧 汪 足 的 汇 为 ft。 对 每 种 商品 
相互 独立 地 存在 着 流 的 会 话 :从 每 个 结 点 出 发 的 每 种 商品 的 网 络 为 0， 除非 该 结 点 为 该 种 商品 的 源 或 汇 。 从 
1 到 vv 所 有 商品 的 网 络 流 之 和 不 能 超过 ctu，， 并 且 商 品 流 就 是 以 这 种 方式 相互 影响 的 。 每 种 商品 的 流 的 
值 是 关于 该 商品 的 从 源 出 发 的 网 络 流 。 全 部 流 的 值 为 所 有 jp 种 商品 流 的 值 的 和 。 证 明 : 通过 把 寻找 多 商品 
流 网 络 中 全 部 流 的 最 大 秆 问 题 用 线性 程序 设计 的 方法 来 镀 述 ， 可 以 找到 全 雇 这 一 问题 的 多 项 式 时 间 的 算 
污 。 


27.2-1 在 图 27.1 人 b) 中 ， 通 过 制作 8，mw，w TY 到， 贡 的 该 是 多少 ?该 割 的 容量 是 密 少 ? 

27.2-2 试 说 明 Edmonds 一 Karp 算 靶 在 图 27.1(a) 所 示 的 流 ， 网 络 上 执行 的 过 程 。 

27.2-3 在 图 27.6 的 实例 中 ， 对 应 于 图 中 最 大 流 的 最 小 提 是 多 少 ?在 例 中 出 现 的 增 广 路 径 中 ， 哪 两 条 路 
径 消 去 了 先前 被 传输 的 流 ? 
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27.2-4 证 明 对 任意 一 对 结 点 u 和 Yv 以 及 任意 容量 、 任 意 流 函数 CC 和 f 有 
cf，YjHeKu， 则 一 以 0，ViHCtV， 册 。 
27.2-5 在 27.1 节 中 ， 我 们 通过 增加 具有 无 限 客 量 的 边 把 一 个 多 源 多 汇 的 流 网 络 转换 为 单 源 单 汇 的 流 
络 。 证 明 : 如 果 初 始 的 多 站 允 汇 网 络 中 的 边 具 有 有 限 的 容量 ， 则 转换 后 所 得 的 网 络 中 的 任意 藻 均 有 有 限 
值 . 

27.2-6 根 定 在 多 源 多 汇 问题 中 每 个 源 % 产生 Pi 单位 的 流 ， 即 fsi，V) = 由。 同时 假定 每 个 汇 1 消耗 qi 
单位 的 流 ， 即 fV， 刁 =9， 其 中 ?ip 一》 向 ”说 明 如 何 把 寻找 一 个 流 上 以 满足 这 些 附 加 性 质 的 问题 转化 为 
在 一 个 单 汰 单 汇流 网 络 中 寻找 最 大 流 的 问题 。 

27.2-7 证 明 引 理 27.3。 

27.2-8 证 明 一 个 网 络 台 =(V， 加 的 最 大 流 总 可 以 被 -个 至 多 由 旧 | 条 增 广 路 径 所 组 成 的 序列 发 现 . 〔 提 
杰 : 在 找 出 归 太 流 后 再 确定 路 径 。) 

27.2-3 无 向 狸 边 的 连接 度 是 指 为 了 使 图 不 连通 必须 去 掉 的 最 少 边 数 帮 例如， 树 的 边 连接 度 为 1， 结 
点 的 循环 链 的 边 连 接 度 2， 说 明 如 何 对 至 多 |V| 个 流 网 络 (每 个 流 亲 络 有 OKW 个 结 点 和 DIEB) 条 边 ) 运 行 最 大 流 
算法 就 可 确定 一 无 向 图 的 边 连接 度 。 

27.2-10 证 遇 BEdmonds-Karp 算法 在 至 多 进行 IVIIBI7 4 殉 选 代 后 将 斤 止 执行 。( 握 示 : 对 任意 边 (u， 
VJ， 考 虑 (nn， 人 为 关键 边 的 时 刻 之 间 8 8s， 山 和 Su， 晶 如何 变 化 。) 


27.3-1 对 图 27.9(b) 所 示 的 度 网 络 运行 Ford~Fulkerson 算法 , 并 指出 每 次 对 流 增加 以 后 所 得 的 残留 网 
络 。 我 们 对 工 中 的 结 点 从 上 到 下 编 为 1 到 5 号 ， 对 及 中 的 结 点 从 上 到 下 编 为 5 到 9 号 。 在 每 次 选 代 中 ， 找 
出 按 辞 典 顺 库 最 小 的 一 条 增 广 路 径 。 

27.3-2 证 明定 理 27.11， 

27.3-3 设 G=(V，BE) 为 二 分 图 ， 其 结 点 分 划 为 VY=LUR， 且 台 是 其 相应 的 流 网 络 ， 试 对 
Ford-Fulkerson 的 执行 中 在 台中 技 出 的 任意 增 广 路 径 的 长 度 给 出 一 个 适当 的 上 限 . 

27.3-4* ”完备 匹配 是 指 图 中 等 个 结 点 均 被 匹配 ， 设 马 ={V，B) 是 其 结 点 分 划 为 V= 工 [JR 的 一 无 向 二 
分 图 、 其 中 |L|= |l。 对 任意 其 三 YY， 定义 六 的 邻 城 为 : 

NOODJ=IyeEV: 对 xEXIz， 六 EEH} 

即 为 与 X 的 某 元 素 相 邻 的 结 点 集合 。 证 明 如 二 Hall 定理 ,G 中 存在 一 完备 匹配 ， 当 且 仅 当 对 鱼 个 子 集 和 三 
L，。 有 |A| 过 IOA 咱 。 

27.3-5*+ ”在 二 分 图 台 =(V，B) 中 ，Y= 工 LUR， 如 果 每 个 结 点 的 度 均 为 4， 列 说 该 图 是 d- 正 则 的 。 每 
个 4- 正则 二 分 图 有 人 L|= | 及 | 成 立 。 生 上 明 ， 对 每 个 d- 正 则 二 分 图 ， 其 相应 流 网 络 的 最 小 制 的 容量 为 |L|。 运 用 
该 结论 证 明 :， 每 个 4 正则 二 分 图 均 有 一 势 为 上 Li 的 匹配 。 


27.4-1 说 明 如 何 和 实现 一 般 性 先 卫 推 进 算法 , 使 得 每 次 提升 操作 需要 DIV) 时 间 ， 每 次 推进 操作 项 要 
OU 时间， 而 整个 算法 的 时 间 为 DIVE)， 

27.4-2 证明, 在 执行 全 部 的 DIV 次 提升 操作 时 , 一 般 性 先 流 推 进 算法 所 需 的 全 部 运行 时 间 仅 为 
”AMVE) 

27.4-~3 假定 运用 先 流 推进 算 落 找 出 了 流 网 络 怠 = 人 YY， 司 中 揭 最 大 注 。 试 给 出 一 种 快速 算法 以 找 出 吕 
的 最 小 着 . 

27.4-4 写 出 一 有 效 的 先 统 推进 算法 以 找 出 一 二 分 图 的 最 大 匹配 . 

27.4-5 假定 度 网 络 台 =(V，B) 中 所 有 边 的 容量 都 属于 集合 {1，2，.…， 好 。 斌 用 |Vj，IEI 和 k 来 描述 
一 般 性 先 流 推 进 算 法 的 运行 时 间 { 提 示 : 一 条 边 在 成 为 愧 和 边 前 能 承受 多 少 次 不 馅 和 推进 人 

27.4-6 证 明 INEITIALIZE-PREFLOW 的 第 7 行 可 以 改 为 hfsl--|wIG]I-2， 这 并 不 影响 一 般 性 先 流 推 
进 算法 的 正确 性 和 其 渐 近 意义 上 的 性 能 指标 。 

274-?7 设 iu，v 为 残留 网 络 Gr 中 从 u 到 v 的 距离 ( 边 的 数目 ) 证 明 过 程 
GENERIC-PREFLOW-PUSH 保持 下 列 性 质 : 车 hu<|IY， 网 htod 和 aa， 二 并 县 著 h[u 关 |Yi， 则 
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h[u] 一 ws 上 Lu，s)。 

27.4-8* ”如 上 个 练习 题 中 ， 设 5u， 妇 为 残留 网 络 Gr 中 从 到 v 的 虐 离 。 说 明 如 何 黎 改 一 般 人 性 先 流 
推进 算法 以 保持 下 列 性 质 : 车 hul<iVI、 则 h[ul= gu， 仿 并 且 若 hal=Iwl， 则 hfol--iIV|= ko，s)。 为 保 
持 这 一 性 质 , 算法 的 全 部 运行 时 间 应 为 O(VE)， 

27.4-9 证 明 对 于 |V|z>4， 在 流 网 络 G=({V，BE) 上 运行 GENERIC- PREFLOW- PUSH 时 所 执行 的 
非 饱 各 推进 的 操作 次 数 至 多 为 4VPIE|。 


27.5- 上 用 图 27.11 所 示 的 方法 说 明 LIFT-TO-FRONT 对 图 27.1(aj 中 的 流 网 络 执行 的 过 程 。 假定 工 
中 的 初始 结 点 顺序 为 <vYi，m，v，wW> ， 相 邻 表 为 : 
N[v]= <s，v，> 
N[v.]= 生 s，Vi，V， 友 > 
N[vj=<v va vt> 
N[v] = <v2，v，t> 
27.32* 我们 希望 通过 对 溢出 结 点 设置 一 个 先进 先 出 队列 葛 方 法 实现 先 流 推进 算法 ， 算 法 反复 释放 
处 于 陵 头 的 结 点 ， 尾 何在 释放 前 不 为 誉 出 但 宏 放 后 变 为 席 出 的 结 点 被 放 在 队列 末尾 。 当 了 共 头 结 点 被 二 放 后 
就 把 它 从 队列 中 去 掉 。 当 队列 为 空 时 ， 算 法 繁 止 。 证 明 可 以 实现 这 一 算法 , 使 其 能 在 OKY3 习 的 时 间 内 计算 出 
最 大 流 .。 
27.35-3 证 明 ， 如 果 LIFT 仅 和 通过 计算 huj<-h[ul+l 来 更 新 h[u， 一 般 性 算法 依 热 正 确 。 这 一 变化 对 
LIFT-TO-FRONT 的 性 能 分 析 有 何 影 响 ? 
27.5-4* ”证 骨 :， 如 果 我 们 总 是 释放 最 高 的 溢出 结 点 ， 则 可 以 使 先 流 推进 方法 的 运行 时 间 变 为 O(V9)。 
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第 七 篇 ”论题 选编 


本 箭 主 要 是 对 一 些 算法 课题 进行 讨论 ， 这 些 课 题 是 对 本 书 前 面 一 部 分 材料 的 扩展 和 补 
充 。 在 一 些 章节 中 介绍 了 新 的 算法 ， 如 组 合 电 路 和 并 行 计算 机 ， 其 他 部 分 主要 论述 了 算法 应 
用 的 特殊 领域 ， 如 计算 斤 何 和 数论 。 最 后 两 章 对 设计 有 效 算 法 所 受 的 一 些 限 制 进行 了 探讨 ， 
介绍 了 克服 这 些 限 制 的 相应 技术 。 

第 二 十 八 章 将 给 出 第 -- 种 并 行 计 算 檬 型 : 比较 网 络 。 粗 覆 地 说 ， 一 个 比较 网 络 是 允许 同 
时 进行 很 多 比较 的 一 种 算法 。 这 一 章 说 明了 如 何 建立 比较 网 络 以 使 其 在 O(lg 如 ) 的 运行 时 间 
内 对 几 个 数 进 行 排序 。 

第 二 十 无 章 中 介绍 了 另 一 种 并 行 计算 模型 : 组 合 电路 。 这 一 章 说 明了 通过 使 用 一 种 称 为 
先行 进位 加 法 器 的 组 合 电路 ， 我 们 可 以 在 O(1g 冲 的 时 间 内 把 两 个 n 位 数 相 加 。 本 章 还 将 介 
绍 如 何在 OU mn) 的 运行 时 间 内 对 两 个 nm 位 数 相 尼 。 

第 - 汪 十 章 理 介绍 一 种 称 之 为 PRAMNM 的 并 行 计 算 一 般 模型 。 本 章 将 讨论 基本 的 并 行 技 
术 、 包 括 指 针 转 移 ， 前 轰 计 算 和 欧 拉 回 路 等 技术 。 大 多 数 技术 都 是 采用 简单 数据 结构 (如 表 
称 树 ) 来 说 明 的 。 本 帝 中 也 对 并 行 计算 中 的 一 般 癌 题 进 行 了 讨论 ， 其 中 包括 工作 效率 和 对 共 | 
享 存 储 器 并 发 在 取 ， 在 本 章 中 证 明了 Brent 定理 ， 该 定理 主要 说 明 并 行 计算 机 如 何人 能够 有 效 | 
地 模拟 组 合 电 路 。 最 后 , 给 出 了 尖 于 排序 的 一 个 高 效 随 机 算法 和 关于 破坏 表 的 对 称 性 的 一 个 | 
确定 算法 。 

第 .下 一 蔓 钱 究 了 关于 条 阵 操作 的 有 效 算 法 。 本 意 开 始 时 论述 了 Strassen 算法 ， 该 算 
法 能 吏 在 Otn2 妇 的 运行 时 间 内 对 商 个 nxan 答 阵 进行 乘法 运算 。 然 后 该 章 阑 述 了 两 种 一 般 
性 方法 一 -LU 分 艇 和 LUP 分 解 一 一 以 在 On?) 的 运行 时 间 内 用 高 斯 消去 法 求解 线性 方程 
组 。 沪 章 也 说 明了 可 以 运用 Strassen 算法 更 快 地 求解 线性 系统 ， 并 且 从 浙 近 意义 上 来 说 ， 
矩阵 求 送 和 第 阵 乘 法 丙种 运算 能 够 同样 快 地 执行 。 在 本 章 最 后 说 明了 当 线 性 方程 组 无 确定 解 
时 如 何 获得 最 小 二 乘 近似 解法 . 

第 三 十 一 章 中 要 介绍 有 关 多 项 式 的 操作 和 一 种 有 名 的 信 导 处 理 技术 一 一 快速 傅 里 叶 变 换 
FEFT 一 一 避 才 和 于 在 On 地 中 的 运行 时 间 内 计算 两 个 mn 次 多 项 式 的 乘积 。 本 章 也 探讨 7 FFT 
的 有 效 实现 方法 ， 包 括 并 行 电路 . 

第 革 二 二 章 将 介绍 有 关 数 论 的 算法 。 在 对 数论 的 基本 知识 进行 简单 回顾 后 ， 本 章 介 绍 了 ， 
计算 景 大 公司 数 的 欧 拉 算 法 , 接着 给 出 了 求解 模 运算 线性 方程 组 的 算法 以 及 求解 一 个 数 的 宏 
对 另 一 个 数 的 模 的 算法 。 本 章 还 介绍 了 数论 算法 的 一 个 有 趣 的 应 用 实例 : RSA 公用 铀 匙 密 
留 系统 。 这 一 密码 系统 不 仅 可 用 于 信息 加 密 以 使 收 方 不 能 读 懂 信 息 内 容 ， 而 且 可 用 于 提供 数 
字 签 名 ， 本 章 阐述 了 Miller-Rabin 随机 性 素数 测试 ， 应 用 它 可 以 有 效 地 找 出 大 的 素数 一 
这 正 是 RSA 系统 的 重要 要 求 。 本 章 最 后 论述 了 用 于 把 整数 分 解 因数 的 *rho" 启 发 性 方法 ,并 
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讨论 了 对 整数 分 解 因数 的 技术 现状 。 

第 三 十 四 章 将 讨论 这 样 一 个 问题 : 在 一 段 给 定 的 正文 字符 串 中 找 出 给 定 模式 的 子 字符 审 
的 全 部 出 现 位 置 。 这 一 问题 在 文本 编辑 程序 中 经 常 出 现 。 本 章 首先 考虑 由 Rabin 和 天 arp 发 
明 药 一 种 很 精致 的 方法 。 接 着 ， 在 考察 了 基于 有 限 自动 机 的 一 种 有 效 的 解决 方法 后 ， 论 述 了 
Knuth-Morris-Pratt 算法 ， 该 算法 对 模式 进行 预 处 理 ， 从 而 获得 很 高 的 效率 。 本 章 最 后 阅 
述 了 由 Boyer 和 Moere 首先 给 出 的 -~ 种 字符 串 匹 配 算 法 。 

计算 几何 是 第 三 十 五 章 所 讨论 的 课题 。 在 讨论 了 计算 刀 何 的 基础 性 知识 后 ， 本 章 说 明了 
“彻底 性 "方法 如 何 有 效 地 确定 一 个 线性 集合 中 是 否 包 售 交 叉 点 。 可 找 出 一 个 结 点 集合 的 西 包 
的 两 种 算法 一 一 Graham 扫 撒 算法 和 Javis 跨 步 算 
本 章 最 后 阐述 了 一 种 在 平面 上 的 一 组 给 定 结 点 中 找 出 最 近 的 一 对 结 点 的 有 效 算法 。 

第 三 十 六 章 涉 及 NP-- 完 全 问题 。 许 多 有 趣 的 计算 问题 都 是 NP-- 完 全 的 ， 但 目前 还 没有 
解决 这 一 问题 的 多 项 式 时 间 的 算法 。 本 章 阐 述 了 确定 NP-- 完 全 性 的 技术 ， 介 绍 了 几 种 经 典 
NP-- 完 全 的 问题 ， 如 确定 一 个 图 中 是 否 有 汉密尔顿 回路 ， 确 定 -- 个 布尔 表达 式 是 否 是 可 满 
足 的 ， 以 及 确定 一 个 给 定 的 数 的 集合 是 否 包 售 一 个 其 和 为 给 定 目标 值 的 子 集 。 本 章 还 证 明了 
著名 的 货 妆 担 问题 是 NP- 完 全 的 。 

第 三 十 七 章 说 明 如 何 运 用 明 近 算法 来 找 出 NP_ 完 全 问题 的 近似 解 . 对 一 些 NP- 完 全 的 
间 题 ， 接 近 理 想 解 的 近似 解 还 是 较 容易 获得 的 ， 但 对 其 他 一 些 问 题 , 即使 上 月 前 已 知 的 最 好 的 
逼近 算法 , 其 性 能 随 着 问题 规模 的 增加 而 明显 降低 。 当 然 ，、 也 有 一 些 问 题 ， 如 果 我 们 增加 其 
计算 时 间 就 可 能 获得 更 好 的 近似 解 。 在 本 章 中 通过 对 结 点 李 盖 问题 、 货 郎 担 问 题 ， 集 合 驯 盖 
问题 以 及 子 集 求 和 问题 的 讨论 , 前 述 了 这 种 可 能 性 。 





第 二 十 八 章 “排序 网 络 


在 第 二 篇 中 ， 我 们 学 习 了 关于 让 行 计算 机 的 排序 算法 (随机 存 取 计 算 机 ， 或 RAM)， 这 
类 计算 机 每 次 只 能 执行 一 个 操作 。 在 本 章 中 ， 我 们 所 讨论 的 排序 算法 是 基于 计算 上 的 一 种 比 
较 网 络 模型 的 基础 之 上 的 。 在 这 种 网 络 模型 中 可 以 同时 执行 多 个 比较 操作 。 

比较 网 络 与 RAM 的 区 别 主要 在 于 两 个 方面 。 首 先 ， 前 者 只 能 执行 比较 。 因 此 ， 像 枚 
举 排序 ( 兄 第 9.2 节 ) 这 样 的 算法 就 不 能 在 比较 网 络 上 实现 。 其 次 ， 在 RAM 模型 中 ， 操 作 串 
行进 行 ， 即 一 个 操作 紧 接 着 另 一 个 操作 ; 在 比较 网 络 中 ， 操 作 可 以 同时 发 生 ， 或 “以 并 行 方 
式 " 发 生 。 正 如 我 们 将 要 看 到 的 ， 这 一 特点 使 得 我 们 能 够 构造 出 一 种 在 次 线性 运行 时 间 内 对 
na 个 值 进行 排序 的 比较 网 络 。 

在 28.1 节 开 始 ， 我 们 给 出 了 比较 网 络 和 排序 网 络 的 定义 。 我 们 用 网 络 深度 的 概念 对 比 
较 网 络 的 “运行 时 间 " 也 给 出 了 一 个 自然 的 定义 。28.2 节 证 明了 “0-1 原则 >， 这 一 原则 大 大 减 
轻 了 分 析 排 序 网 络 的 正确 性 所 要 做 的 工作 。 

我 们 将 格 设 计 的 有 效 排序 网 络 实质 上 是 1.3.1 节 中 合并 排序 算法 的 一 个 并 发 性 变 体 。 设 
计 过 程 分 为 三 个 步 又 。28.3 节 章 述 了 将 成 为 其 他 算法 的 基石 的 * 双 调 " 排 序 程 序 的 设计 。28.4 
节 中 对 双 调 排序 稍 作 修改 以 生成 一 个 合并 网 络 ， 该 网 络 能 够 把 两 个 排序 序列 合并 为 一 个 排序 
序列 ， 最 后 、 在 28.5 节 中 ， 我 们 把 这 些 合并 网 络 组 成 一 个 排序 网 络 ， 使 其 能 在 O(1e2m) 的 运 
行 时 间 内 对 联 个 值 进 行 排序 。 


28.1 比较 网 络 


排序 网 络 是 能 对 其 输 和 人 进行 排序 的 比较 网 络 ， 所 以 现在 有 必要 先 讨 论 比 较 网 络 及 其 特 
点 ， 托 较 网 络 仅 电线 路 和 纪 较 器 构成 ， 如 图 28.1(aj 中 所 示 ， 比较 器 是 具有 两 个 答 人 XxX 和 Yy 
以 及 两 个 输出 x 和 YY 的 一 个 装置 ， 且 执行 下 列 枯 数 : 

X 一 mintx，y) 


YY 一 max(K，7y) 


时 昌 了 了 且 下 
症 三 疝 阁 区 扣 ” 才 二 miIniy,y] 
conhparuler 3 7 
一 和 J = fnBK[ 和 ,7 - = maxtzy1 


也 














《1 (hn 
28.1 纪 较 了 网络 
因为 里 28.1(a) 中 给 出 的 比较 器 的 图 形 表示 太 大 而 不 方便 ， 所 以 我 们 将 按 常规 把 比较 峰 
画 为 一 根 垂直 线 ， 如 融 28.1b) 所 示 。 输 入 在 左面 ， 输 出 在 右面 ， 较 小 的 输 大 值 在 输出 端的 
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上 部 ， 较 大 的 输入 值 在 输出 端的 下 部 。 因 地 ， 可 以 认为 比较 器 对 两 个 输 人 进行 了 排序 . 

假定 每 个 比较 操作 占用 的 时 间 为 Di)。 换 句 话 说 ， 假 定 出 现 输入 值 x 和 、Yy 与 产后 输出 
值 x 各 YY 之 间 的 时 间 为 胡 数 。 

线路 把 … 个 值 从 一 处 传输 到 另 一 处 。 它 可 以 把 一 个 比较 器 的 输出 端 与 另 一 个 比较 器 的 输 
人 端 由 连 ， 在 其 他 情况 下 它 竖 人 么 是 网 络 的 输 人 线 ， 要 么 是 网 络 的 输出 线 、 在 本 章 中 我 们 都 假 
定 比 较 网 络 含 n 条 输入 线 a，a，…， ai， 以 及 条 输出 线 bj，b。，…，、b,。 和 需要 排序 的 值 
通过 输入 线 进 人 阅 络 ， 由 网 络 计算 出 的 结果 通过 输出 线 输出 。 同 样 ， 我 们 所 说 的 输入 序列 
<3al，a，…，a > 和 输 山 序列 <bl，b，…，b > 分 别 指 输入 线 和 输出 线 中 的 值 。 就 是 
说 ， 我 们 用 同 … 各 称 来 表示 线路 及 其 运载 的 值 。 其 体 合 义 可 根据 寺 下 文 来 兰 断 。 





deph 11 2 32 deph 11 22 3 
(ce)} {d) 
图 28.2 4 输入 . 4 输出 比较 网 络 的 运行 过 程 


图 28.2 说 明了 一 个 比较 网 络 ， 它 是 一 个 由 线路 互相 连接 着 的 比较 器 的 集合 .我 们 把 具 
有 个 输 和 人 的 比较 网 络 画 成 一 个 由 匡 条 水 平 线 组 成 的 图 ， 比 较 器 则 垂直 地 与 两 条 水 半 线 相 
连接 。 需 要 注意 的 是 图 中 的 一 条 线 并 不 是 仅 代 表 一 条 线路 ， 而 是 连接 到 各 个 比较 器 上 的 不 回 
线路 的 一 个 序列 。 例 如 ， 图 28.2 最 项 一 条 线 代 表 三 条 线路 ;连接 到 比较 器 A 的 输入 端 上 的 输 
人 线路 alj 把 比较 器 A 的 上 面 一 个 输出 端 与 比较 器 C 的 一 个 输入 端 相连 的 一 条 线路 以 及 源 寺 
比较 器 C 的 输出 端的 输出 线路 b。 每 个 比较 器 的 输入 端 要 么 与 网 络 的 ma 条 输入 线路 ai， 
aa …，a 中 的 一 条 由 连接 ， 草 么 与 另 一 个 比较 器 的 输出 端 相连 接 。 类 似 地 ， 每 个 比较 器 的 
输 关 问 要 么 与 网 络 的 n 条 输出 线路 bl，b:，…，b, 中 的 一 条 相连 接 ， 上 过 么 与 另 一 个 比较 如 
的 输入 端 相 连接 。 互 相连 接 的 比较 器 主要 应 满足 如 下 要 求 : 其 互相 连接 所 成 的 鲍 中 必须 没有 
回路 姐 果 我 们 沿 图 中 一 个 比较 器 的 输出 端 到 达 另 一 个 比较 器 的 输入 兹 理 到 输出 端 、 输 人 端 
…， 如 此 下 去 ， 我 们 通过 的 路 径 必 须 不 能 回 到 第 一 个 比较 器 ， 也 不 能 两 次 经 过 问 一 个 比较 
器 。 因 此 ， 如 图 28.2 所 示 ， 我 们 画 一 个 比较 网 络 时 可 以 把 网 络 输 人 端 曾 在 左边 ， 临 把 网 络 
输出 端 画 在 右边 ， 数 据 从 网 络 左边 向 右边 移动 从 而 通过 网 络 。 
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愉 有 当 闻 时 有 两 个 输 人 人 时， 比较 器 才能 产生 输出 亿 。 例 如 ， 在 图 28.2( 电 中 ， 假 设 在 时 
刻 0 输 和 线路 上 出 现 -- 输 人 序列 <9，5，2，6> 。 则 在 时 刻 0， 只 有 比较 器 A 和 了 同时 存 
在 两 个 输入 值 。 假 定 每 个 比较 器 要 花 1 个 单位 的 时 间 以 计算 出 输出 值 ， 则 比较 器 A 和 了 B 在 
时 刻 1 产 后 输出 值 ， 其 结果 如 图 28.2(b) 所 示 。 注 意 ， 比 较 器 A 和 了 B 同时 或 并 行 地 产生 其 输 
日 值 。 现 在 ， 在 时 刻 1， 比 较 此 CC 和 了 D 都 有 两 个 输入 值 。 一 个 单位 的 时 间 以 后 ， 即 在 时 刻 
2 C 和 了 D 产生 输出 值 ， 旭 疼 28.2(e) 所 示 。 比 较 器 C 和 Dp 同样 也 是 并 行 操 作 ， 比 较 器 C 下 
面 的 输出 端 和 比较 器 D 下 面 的 输出 端 分 别 连接 着 比较 网 络 的 输出 线路 bl 和 bj， 因此 这 些 网 
络 输 出 线路 在 时 刻 2 运载 着 其 最 终 值 。 同 时 ， 在 时 刻 2， 比 较 器 三 具有 有 效 的 输入 值 ， 图 
38.2(d] 说 明 它 在 时 间 3 产生 其 输出 值 。 这 些 值 由 网 络 输出 线路 b 和 bs 运载 这 样 我 们 就 处 ， 
到 输出 序列 <2，5，6，9> ， 

在 每 个 比较 器 均 运 行 单位 时 间 的 假设 下 ， 我 们 可 以 对 比较 网 络 的 * 运 行 时 间 ” 作 出 定义 ， 
这 就 是 从 输入 丝 路 接收 到 其 值 的 时 刻 到 所 有 输出 线路 收 到 其 值 所 花费 的 时 间 。 非 正式 地 说 
这 一 运行 时 间 就 是 任何 输入 元 素 从 输入 线路 到 输出 所 经 过 的 比较 器 数目 的 最 大 值 。 我 们 更 正 
式 地 定义 -一 条 线路 的 深度 如 下 : 比较 网 络 的 输入 线路 深度 为 0。 如 果 一 个 比较 器 有 两 条 深度 
分 别 为 由 和 d 的 输入 线路 ， 则 其 输出 线路 的 深度 为 max(d., .d,)+1。 因 为 在 比较 网 络 中 不 
存在 关于 比较 器 的 回路 ， 所 以 一 条 线路 的 深度 总 有 定义 ， 并 且 我 们 定义 比较 器 的 深度 为 其 输 
出 线路 的 深度 。 轿 28.2 说 明了 比较 器 深度 的 概念 ， 一 个 比较 网 络 的 深度 是 它 的 输出 线路 的 
最 大 深度 ， 或 者 等 价 地 ， 是 其 比较 器 的 最 大 这 度 ， 例 如 ， 图 28.2 中 的 比较 网 络 的 深度 为 
3、 这 是 因为 比较 器 王 的 深度 为 3。 如 果 每 个 比较 器 产生 其 输出 值 需要 1 个 单位 的 时 间 且 网 
络 的 输 和 人 出现 于 时 刻 0， 则 一 个 深度 为 4 的 比较 器 应 该 在 时 刻 d 产生 其 输出 值 。 因 此 网 络 的 
深度 应 等 于 网 络 的 所 有 输出 线 均 产 生 输 出 值 的 时 刻 。 

排序 网 络 是 指 对 每 个 输 和 序列， 其 输出 序列 均 为 单调 递增 ( 即 bl 和 bz 系 … 和 ba 的 一 种 比 
较 网 络 。 当 然 ， 并 非 每 个 比较 阅 络 都 是 排序 网 络 ， 不 过 图 28.2 中 的 网 络 是 排序 网 络 。 为 了 
搞 清楚 这 一 点 ， 请 注意 在 时 刻 1 后 。 四 个 输入 值 中 的 最 小 值 或 者 产生 于 比较 器 A 的 上 面 一 
个 输出 端 ， 或 者 产生 于 比较 器 B 的 上 面 一 个 输出 端 。 

因此 ， 在 时 刻 2 后 ， 该 最 小 值 必定 处 于 比较 器 C 的 上 面 一 个 输出 端 。 同样 我 们 可 以 运 
用 对 称 性 证 明 在 时 间 2 后 ， 中 个 输入 值 中 的 最 大 值 必定 由 比较 器 D 的 下 面 一 个 输出 端 输 
出 。 因 此 对 比较 器 E 来 说 ， 剩 下 的 工作 就 是 保证 其 中 间 两 个 值 处 于 正确 的 输出 端 ， 这 一 工 
作 在 时 刻 3 完 成 。 

比较 岗 络 与 过 程 的 相似 之 处 在 于 它 指 定 如 何 进行 比较 ， 其 不 同 之 处 在 于 其 实际 规模 决定 
于 输入 和 输出 的 数 日 。 因 此 ， 我 们 实际 是 在 描述 比较 网 络 的 “家 族 "。 例 如 ， 本 章 的 目标 就 是 
征 改 - .个 关于 契 效 排序 网 络 的 家 族 排序 程序 SORTER。 我 们 通过 一 个 家 族 名 和 输入 数目 (等 
于 输出 数 且 来 说 明 一 个 家 族 中 的 某 个 指定 网 络 。 例 如 ， 在 家 族 SORTER 中 具有 个 输 人 
和 mn 个 输出 的 排序 网 络 定义 为 SORTER[In]. 


28.2 ”0-1 原则 
0-1 原则 认为 ， 如果 对 于 属于 集合 {0，1} 的 每 个 输入 值 ， 排 序 网 络 都 能 正确 运行 ， 则 对 


任意 的 输入 值 ， 它 也 能 正确 运行 (输入 值 可 以 为 整数 ， 实 数 或 任意 线性 排列 的 值 的 集合 )。 当 
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我 们 购 造 排序 网络 和 其 他 比较 网 络 时 ，0-1 原则 使 得 我 们 可 以 把 注意 力 集中 于 对 仅 由 0 和 1 
组 成 的 输 大 邦 列 进行 由 应 损 作 。 一 -号 我 们 构造 好 排序 网 络 并 让 明 它 能 对 所 有 的 0-1 序列 进 
行 排 译 ， 我 们 就 可 以 过 行 0-1 原则 说 明 它 能 对 企 意 值 的 序列 进行 正确 的 排序 。 

0-1 眶 则 的 证 明 依 赖 于 音调 递增 二 数 的 概念 (第 2.2 节 )， 

引 理 28.1 如 果 比 较 网 络 把 输入 序列 a= < 四 ，3a2，…，a > 转化 为 输出 序 询 b= <b， 
b:，…、b>， 由 对 任意 单调 递增 项 数 f， 该 网 络 把 输 人 序列 flaj= <ffa)，fa)，…， 
fa> 转 化 为 输出 序列 fb)= <ffb)，fb Kb)> 。 

证 明 : 我 们 移 来 让 塌 以 下 结论 : 如 果 卫 是 单调 递增 画 数 ， 则 输 人 为 foo 和 fy) 的 比较 回 
产生 的 输出 为 人 mintx，yY) 和 fmax(x，y))。 然 后 我 们 通过 归纳 证 明 引 理 。 


max(Axjui = 所 maxf y 芒 
图 28.3 引 理 28.1 的 证 明 过 程 中 的 比 思 器 的 操作 ,了 开 为 单调 递增 函数 


为 了 让 明王 耐 的 了 论断， 我们 考察 一 个 输入 值 为 和 Yy 的 比较 器 。 该 比较 器 的 于 端 输出 为 
mintx，y)， 此 下 站 输出 为 max(x，yY)。 假 定 现 在 我 们 把 fx 和 女 四 作为 该 比较 器 的 输入 ， 如 
图 28.3 所 示 ， 则 该 比较 器 的 上 端 输出 为 min(Gfo)，fy7， 下 端 输出 为 max(ffxz)，fv)， 由 于 
f 症 单 调 递增 图 数 ， 若 xs 和 y， 则 fos<fy)， 因 此 我 们 有 下 列 等 式 : 

minmtf 攻 xx， 人 y) 王 人 min(x， 轨 ) 

ITUxX( 人 X)， 八 Y 二 拉 Pmnax(X，Yy 放 
所 以 当 把 fx 和 如 作为 比较 器 的 输入 时 ， 它 所 得 出 的 值 就 是 fmin(x，y)D 和 fmax(x，Y))， 
这 样 就 让 明了 上 述 论 断 正 确 。 

我 们 现在 对 一 般 的 比较 网 络 中 每 条 线路 的 深度 进行 归纳 ， 从 而 证 明 一 个 比 上 述 引 理 更 缉 
的 统 论 : 当 把 序列 a 作为 网 络 的 输入 时 ， 如 果 基 条 线路 的 值 为 丰 ， 则 当 把 序列 fa) 作 为 网 络 . 
的 输入 时 ， 该 线路 的 供 为 fa。 因为 输出 线路 包 售 于 上 述 结 论 中 ， 所 以 计 明 了 该 结论 , 也 就 
证 明子 引 惠 ， 

作为 时 纳 的 基础 ， 我 们 考察 深度 为 0 的 线路 ， 即 输入 线路 ai。 此 时 结论 显然 成 立 : 当 
人 区 被 应 用 于 闲 络 时 、 输 入 线路 运载 的 值 为 Ka)j。 下 面 进 行 归 纳 。 考 虑 深 庆 为 由 的 一 条 线 
路 ， 其 中 d 郑 1。 该 线路 是 深度 为 d 的 比较 器 的 输出 线路 ， 旦 该 比较 器 的 输 和 线路 的 深度 严 
属 小 六 dd， 因 此 根据 归纳 假设 ， 当 序列 a 作为 输入 时 如 果 该 比较 器 的 输 人 线路 上 运载 的 值 为 
it 和 和 ， 浊 党 出 夯 列 fa 作为 输入 时 该 输入 线路 上 运载 的 值 尺 为 fa 和 faij)。 根 据 我 们 先前 
让 明 的 结论 、 沪 比较 占 的 输出 线路 必然 运载 值 Kmin(a，a 力 和 ffmax(ai，ab， 因 为 当 输 入 
玉 询 为 娃 线 路 这 载 的 值 为 min(ai，a3) 和 max(ai，a)， 所 以 定理 得 证 。 

作为 引 理 28.1 的 一 个 度 用 实例 、 图 28.4 说 明了 使 单调 递增 函数 fa= Txy2] 作 用 上 上 阐 
33.2 中 网 络 的 输入 时 所 得 到 的 排序 网 络 。 图 28.4 中 每 条 线路 上 的 值 就 是 把 f 作 用 二 图 28.2 
中 辐 一 条 线路 上 的 值 后 所 得 的 值 . 

当 - -个 比较 网 络 是 排序 网 络 时 ， 引 理 28.1 使 得 我 们 能 够 证 明 下 面 的 重要 结论 ， 

定理 交 .2(0-1 原则 ) 如 果 一 个 具有 mn 个 输 人 的 比较 网 络 能 够 对 所 有 可 能 存在 的 22 个 0 
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和 1 组 成 的 序列 进行 正确 的 排序 , 则 对 所 有 任意 数组 成 的 序列 ,该 比较 网 络 也 可 能 对 其 正确 排 

证 明 : 为 了 引 人 了 矛盾 , 我 们 假定 网 络 能 对 所 有 fr-1 序列 进行 排序 , 但 存在 一 个 由 任意 数 
组 成 的 序列 , 网 络 不 能 对 该 序列 正确 地 排序 。 这 就 是 说 , 存在 一 个 输 人 序列, 其 中 两 个 元 束 ai 
和 ai 满足 ai < ai 们 在 办 出 序列 中 机 讼 后 在 ai 之 前 。 我 们 征 义 一 个 单调 递增 函数 上 为 : 


X 安 3 
fa =| 1 如 果 X > a， 


因为 当 <ai，a，…，an> 作为 输入 序列 时 ， 其 输出 序列 中 a 位 于 a 之 彰 ， 所 以 由 引 理 
28.1 可 知 当 序列 <ffa)，fa)，…，fRaJj> 作 为 输 人 序列 时 ， 其 输出 序列 中 人 ai) 必 位 于 fai) 
之 前 。 但 市 于 fail=1，fa)=0。 这 样 我 们 就 推出 网 络 不 能 正确 地 对 0-1 序列 <ffai)， 
fa:)，…， 克 an)> 进行 排序 ， 这 与 前 面 的 假设 相 韦 慎 。 





朵 28.4 引 理 28.1 的 一 个 床 用 实例 


28.3 双 调 排序 网 络 


均 造 有 效 的 排序 网 络 的 第 一 步 是 构造 一 个 能 对 任意 双 调 序列 进行 排序 的 比较 网 络 。 所 请 
双 调 序列 、 是 指 序列 要 人 么 先 单调 递增 然后 再 单调 递减 ， 要 人 么 先 单 调 递 减 然 后 又 单调 递增 。 例 
如 序列 <1，4，6，8，3，2，> 和 <9，8，3，2，4，56，> 都 是 双 调 的 。 双 调 的 0-1 序列 
的 结构 比较 简单 ， 其 形式 为 91 人 或 101， 其 中 i，j，kz0。 必 须 注意 : 单调 递增 或 单调 
递减 的 序列 也 是 双 调 的 。 

我 们 将 要 构造 的 双 调 排序 程序 是 一 个 能 对 0 和 1! 的 双 调 序列 进行 排序 的 比较 了 网络 。 练 习 
28.3-6 将 要 求证 明 双 调 排序 程序 可 以 对 任意 数组 成 的 双 调 序列 进行 排序 。 


半 清 洁 趾 


双 调 排序 程序 由 n 个 阶段 组 成 ， 其 中 每 一 个 阶段 称 为 -一 个 半 清 洁 器 (the half 一 cleaner)。 
每 个 闭 清洁 器 是 一 个 深度 为 1 的 比较 网 络 ， 其 中 输入 线 [与 输入 线 i+ny 2 进行 比 匀 ，i= 1， 
>、，…，、ny7X 假设 n 为 偶数 )]。 图 28.5 说 明了 一 个 具有 8 个 输 人 和 8 个 输出 的 半 清 洁 器 
HALF-CLEANER[S]. . 

当 由 0 和 1 组 成 的 双 调 序列 用 作 半 清洁 器 输 和 人 时 ， 半 清洁 器 产生 一 个 满足 上 下列 条 件 的 输 
出 序列 : 较 小 的 值 位 于 输出 的 上 半 部 ， 较 大 的 值 位 于 输出 的 下 半 部 ， 并 且 两 部 分 序列 仍然 是 
双 调 的 。 坦 实 上 上 ， 丁 部 分 序列 中 至 少 有 一 个 部 分 是 清 清 的 一 一 全 由 四 或 全 由 1 组 成 。 正 是 由 
于 这 … 性 质 我 们 才 称 其 为 “ 半 清 洁 器 *。({( 注 意 ， 所 有 的 清洁 序列 都 是 双 调 的 。) 下 面 一 个 引 理 
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让 明了 半 清 滞 器 的 这 些 性 质 。 


册 必 
0 bitonic,， 
人 ea 
0 ， 
bitonic | biteatic 
心 ， ， 
| bitonie 
1 


图 28.5 ”比较 阿 络 HALF-CLEANER[8I 








导 ivide compare cotmbine 
4 hitonic. 
昌 本 1 | 1ean 
和 inie 寺 an 本 | 下 mn jn | er 
中 到 一 
四 tttam HG | Hitonic 
| 
fa 
吕 < 吕 | bitnnic 
titnnie 和 站 om 和 和 ja 1 amatia 叶 | 四 
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图 28.6 HALE-CLEANERI 中 可 能 进行 的 比较 
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引 理 28.3 如 果 半 清 洁 贤 的 输入 是 一 个 由 0 和 1 组 成 的 双 调 序列 ， 则 其 输出 满足 尹 下 性 
岳 : 输出 的 上 于 部 分 与 下 半 部 分 都 是 双 调 的 ， 上 半 部 分 输出 的 每 一 个 元 素 至 少 与 下 半 部 分 输 
册 的 每 个 元 蓄 一 样 小 ， 并 且 师 部 分 中 对 少 有 一 个 部 分 是 清洁 的 。 

证 明 : 比较 网 络 HALE-CLEANERIm 把 第 ii 个 输入 与 第 itn72 个 输入 进行 比较 ， 
i==1. 2，…，ny 2。 不 失 : 般 性 ， 假 设 输 人 形 如 : 00…011…100…0( 输 入 为 11…100…011 
…1 的 情形 与 上 述 情 式 吓 对 称 的 )， 根 据 序列 的 中 点 ma72 落 在 序列 中 连续 的 “0" 段 或 连续 “1” 
段 的 不 加 可 分 为 :钟情 况 ， 并 且 这 些 情况 中 有 一 种 (中 点 处 于 连续 的 “1" 段 的 情形 ) 又 可 继续 
分 为 靖 种 情况 。 图 28.6 说 明了 这 四 种 情形 。 在 每 一 种 情形 下 ， 引 理 都 成 立 。 


双 幸 排序 程序 


好 图 3.7 所 本 ， 通 过 递归 地 连接 半 清 活 器 可 以 建立 一 个 双 调 排序 器 ， 它 是 一 个 对 双 调 
省 列 进行 排序 的 网 络 。，BITONIC-SORTER[n] 的 第 一 个 阶段 由 HALF-CLEANERfn] 组 
成 ， 引 引 理 28.3 可 知 ALE-CLEANERIn] 产 牛 两 个 规模 缩小 一 半 的 双 调 序列 ， 且 沦 足 上 
半 部 分 的 每 个 郊 素 至 少 与 不 半 部 分 的 每 个 元 素 一 样 小 。 因 此， 我 们 可 以 运用 两 个 
BITONIC-SORTERIny 3] 分 别 对 两 部 分 递归 地 进行 排序 ， 从 而 完成 整个 排序 工作 。 在 图 
38.7 人 中， 局 经 湖 楚 地 说 明了 递归 的 应 用 ， 在 图 28.7(b) 中 ， 对 递归 进行 了 展开 以 说 明 程 序 
的 其 你 部 分 。BITONIC-SORTERIn] 的 深度 Dam 由 下 列 递归 式 给 出 : 

0 如 果 n=1 
(ny -| E 
Dtny2+1 如 果 m = 一 2 且 Kk 六 1 
可 推 得 其 解 为 : Dln)= jgn。 

因此 ， 我 们 可 以 用 BITONIC-SORTER 对 深度 为 1ga 的 0-1 双 调 序 列 进行 排序 。 由 类 
似 玉 1 原则 的 结论 可 知 : 该 网 络 能 对 由 任意 数组 成 的 双 调 订 列 进行 排序 。 这 一 断言 的 证 
明 留 作 练 习 ( 见 练 避 28.3 一 6 


BITONIC- 
SORTER[n 护 ] 


bitonic Sorted 


BIONIC- 


SORTER[n12] | 


am 





了 28.7 比较 网 络 BITONLL -SOKTERinh， 这 里 m=8 
28.4 合并 网 络 


我 们 将 用 合 放 网 络 米 构 造 排序 网 络 。 所 谓 合并 网 络 是 指 能 把 两 个 已 排序 的 输入 序列 合并 
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为 一 个 有 序 的 输出 序列 的 网 络 。 我们 将 对 BHITONIC--SORTERI[n] 修 改 以 生成 合并 网 络 
MERGERInj。 和 前 一 节 中 的 双 调 排序 类 似 ， 我 们 公 对 输入 为 09-1 序列 的 情况 证 明 合 并 网 络 
的 正确 性 。 练 习 28.4--1 要 求 把 这 一 证 明 扩 充 到 任意 输 人 值 的 情形 。 

合并 网 络 基于 下 列 直 觉 知识 : 已 知 两 个 有 序 序 列 ， 如 果 把 第 二 个 序列 的 顺序 颐 倒 ， 再 把 
两 个 译 列 连接 在 一 起 ， 所 得 的 序列 应 为 双 调 序列 。 例 如 ， 已 知 两 个 有 序 的 0-1 序列 : 
X=00000111 和 站 =00001111， 我 们 把 立 的 顺序 颠倒 ， 得 冯 =11110000， 再 掀 和 和 YY 相 
连接 就 得 到 一 个 双 调 序列 0000011111110000。 因 此 要 合并 两 个 输 人 序列 X 和 立 ， 只 要 对 X 
和 YE 连接 成 的 序列 执行 必 调 排序 就 可 以 了 。 

我 们 通过 修改 BITONIC-SORTER[n] 的 第 一 个 半 清 洁 器 来 构造 SORTER[In]， 构 造 过 
程 的 关键 让 隐 含 地 对 输入 第 二 个 部 分 执行 颠倒 次 序 的 操作 。 已 知 需要 进行 合并 的 两 个 有 序 序 
诈 <a，a，…，ar> 和 <ava ar …，a>。 因 为 对 ii=1，2，…na/2， 
BITONIC-SORTERI{o] 的 半 清 洁 器 把 输入 i 与 输入 ny7 2+i 进行 比较 、 所 以 构造 合并 网 络 的 
第 一 步 是 比较 输入 i 与 输 和 人 ni+r1。 图 28.8 说 明了 其 对 应 关系 。 肉 一 的 精妙 之 处 在 于 和 通常 
的 半 清 滞 器 的 输出 次 序 相 比 ，MERGER() 第 一 步 中 的 上 端 和 下 端 输出 的 次 序 与 通常 相反 
让 于 改 调 序 刘 次序 颐 倒 后 仍然 是 双 调 序列 ， 所 以 合并 网 络 第 一 步 中 的 上 端 和 下 端 输出 满足 引 
理 28.3 中 的 性 质 ， 因 此 可 以 对 上 端 和 下 端 并 行 地 进行 双 调 排序 以 产生 合并 网 络 的 有 序 答 
出 。 
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图 28.8 对 mn=8，MERCGERIo] 的 第 一 维 与 HALF-CLEANERIa 的 比较 
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图 28.9 把 两 个 有 序 输 和 序列 合并 为 一 个 有 序 输出 序列 的 网 络 


所 得 的 合并 网 络 如 图 28.9 所 示 。MERGER[n 中 只 有 第 一 步 与 BITONIC- SORTERUD] 
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不 问 ， 其 他 均 相 问 ， 因 此 ，MERGER[n] 的 深度 与 BITONIC- SORTERIn] 的 这 度 -一 样 ， 也 
基 ten。 


28.$ 排序 网 络 


我 们 现在 已 掌握 所 有 必要 的 工具 以 构造 一 个 能 对 任意 输入 序列 进行 排序 的 网 络 ， 排 序 网 
阁 SORTER[In] 运 用 合并 网 络 ， 实 现 了 对 第 1.3.1 节 中 的 合并 排序 算法 的 并 行 化 。 图 28.10 说 
了 明了 排 皇 网 络 的 构造 及 县 操 作 。{ta) 递归 结构 ; (《b) 递归 的 展开 ; 《c) 用 实际 的 合并 网 络 代 
茸 黑 箱 MERGER。 


SORTER[nP2] 








RMRRGER[] MERTIER[8] 





depth 2 了 入 站 4 
{) 


岗 28.10 递归 地 连接 侣 并 网 络 构成 的 排序 两 络 SORTERIn] 


图 8.10(a) 说 明了 SORTER[nmj 的 递归 构造 。 给 定 n 个 输 和 人 元素， 用 两 个 SORTER 
[3 递归 地 对 商 个 长 度 为 n7 2 的 于 序列 (并 行 地 ) 进 行 排序 ， 然 后 再 用 MERGERim] 对 得 到 
的 棒 个 序列 进行 合并 。 递 归 的 边界 情形 是 n= 1， 此 时 可 以 只 用 一 条 线路 来 对 一 个 元 素 组 成 
的 序 个 进行 排序 。 图 28.10(b) 说 明了 递归 展开 后 所 得 的 结果 ， 而 图 28.10(c) 说 明了 用 实际 的 
合 评 网 络 代 在 图 28.10(b) 的 MERGER 框 所 得 到 的 实际 网 络 。 

在 网 络 SORTER[n] 中 ， 数 据 要 通过 lgn 个 阶段 。 网 络 的 每 一 个 独立 的 输 和 人 已 经 是 由 1 
个 无 素 组 成 的 “个 有 序 序列 。SORTER[n] 的 第 一 个 阶段 包含 n7 2 个 MERGERf2]， 它 们 并 
条 好 对 每 对 由 1 个 匹 泰 组 成 的 序列 进行 合并 以 产生 长 度 为 2 的 排序 序列 。 每 二 个 阶段 n74 
个 MERGER[4 和 ， 和 它们 把 每 对 由 两 个 元 素 组 成 的 排序 序列 进行 合并 以 产生 长 度 为 4 的 排序 序 
列 .… 般 米 说 ， 对 于 k=1，2，…，Jgn， 第 k 个 阶段 包含 av 入 个 MERGER[24， 它 们 
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把 每 对 由 符合 元 素 组 成 的 排序 序列 进行 合并 ， 结果 是 长 度 为 和 的 排序 序列 在 最 后 一 个 
阶段 ， 有 只 产生 由 全 部 输入 值 组 成 的 一 个 排序 序列 。 我 们 可 以 用 归纳 法 来 证 明 这 一 排序 周 络 能 
对 0-1 庆 蜀 进行 排序 ， 因 此 直 0-1 原则 (定理 28.2) 可 知 , 它 也 同样 能 对 任意 输 人 值 进行 排 
|。 

我 们 可 以 递 灯 地 分 析 排 序 网 络 的 深度 。，SORTERm] 的 深度 D(m) 夭 是 SORTERImy 3] 的 
深度 Dtn 21 存在 是个 相同 的 SORT[ny 3]， 它 们 并 行 地 操作 ) 加 上 MERGER[m] 的 深度 1g 
n。 上 因此，SORTERfn] 的 这 度 可 由 下 列 递归 式 定 义 

0 如果 n=1! 
Dn=| 8 
-Ditny2)+legn 如 果 mn 一 2 用 kk 衬 1 

我 们 可以 摸 出 其 解 为 Do = 名 (lg2n)。 由 此 我 们 能 够 在 品 地 各 ) 的 时 间 内 并 行 地 对 nm 个 

区 进行 排 笠 。 


思 考 题 


28 一 ! 转 置 排序 网 络 


如 果 个 比较 网 络 中 每 一 个 比较 器 仅 连 结 相 邻 的 两 根 线 ， 如 图 28.3 所 示 ， 则 我 们 称 这 
种 网 络 为 转 疼 网 络 。 

a. 证 明 : 任何 上 有 个 输入 的 转 笨 网 络 ， 包 括 Rn 个 比较 器 ， 

b, 证 内 : 基 有 nm 个 输入 的 转 填 网 络 为 排序 网 络 ， 当 且 仅 当 它 能 对 序列 <n，n-1，… 
1 > 进行 排 岸 。( 担 未: 证 用 与 引 理 28.1 的 证 明 相 类 拟 的 归纳 法 来 证 明 ) 


TTTTTT 工 
了 PDT 和 
本 本 可 几 要 间 三 因 


图 28.11 8 输入 的 奇 倘 排序 两 络 


… 个 有 具有 mn 个 输入 <ai，a2，…，an> 的 奇偶 排序 网 络 具 有 nm 级 比较 器 。 图 28.11 说 明 
了 … 个 输 人 的 奇偶 转 置 网 络 。 从 图 中 可 以 看 出 ， 对 i=2，3，…，tn-l 和 d=1，2，:… 
n、 线 1 通过 深度 为 尼 的 比较 器 与 线 j=i+H 一 Ui+d 相连 屡 ， 其 中 1 科 j 系 hn。 

.让 明 : 奇人 山 排 岸 网 络 族 的 确 是 一 个 排序 网 络 族 。 


28--2 Batcher 奇人 眉 合 并 网 络 
28.4 节 中 介绍 了 如 和 何 基于 双 调 排序 来 构造 合并 网 络 ， 在 本 问题 中 ， 我 们 将 构造 一 个 奇 
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偶 会 讶 网络。 假设 nm 为 2 的 笑 ， 我们 希望 对 线路 上 的 排序 庆 列 <a，a，…，a > 和 序列 
<anii，ant  … am1>( 序 号 为 奇数 的 元 素 } 进 行 台 并 ， 第 二 个 合并 网 络 把 序列 <a;，a， 
> 与 序列 <anr，an+4，…，aon> (序号 为 偶数 的 元 素 ) 进 行 合并 ， 为 使 两 个 排序 序列 相 
连接 ， 我 们 把 一 个 比较 器 放 在 aa 和 as; 之 间 ，ji=1，2，…，mn， 
a. 对 mn=4， 硬 出 一 个 2n 个 输 大 的 合并 网 络 。 
b. 运用 0-1 驮 则 证 明 : 任意 的 2n 输入 的 奇偶 合并 网 络 是 合并 网 络 。 
c.2n 输入 的 奇偶 合并 网 络 的 深度 是 多 少 ? 规 模 有 多 大 ? 


28-3 排列 网 络 


有 具 有 mn 个 输入 和 Tm 个 输出 的 排序 网 络 中 存在 一 些 开 关 ， 用 来 根据 n! 种 可 能 的 排列 把 网 
络 的 输入 和 输出 进行 和 种 可 能 的 连接 。 图 28.12(a) 说 了 一 个 两 输入 、 两 输出 的 排列 网 络 P,， 
访 网 络 民 包含 一 个 开关 ， 对 输入 输出 存在 两 种 连接 方式 ; 直接 相连 或 交叉 相连 。， 

a. 证 明 : 如 果 把 排序 网 络 中 的 每 一 个 比较 器 换 成 图 28.12(a) 所 示 的 开关 ， 所 得 的 网 络 就 
是 一 全 排列 网 列 。 就 是 说 ， 对 任意 排列 r， 网 络 中 存在 一 种 置 开关 的 方式 可 以 使 输 和 人 i 与 输 
出 元 ( 讨 相 连 。 





图 28.12 排列 网 络 


图 28.t2(b) 说 明了 一 个 8 输入 、8 输出 排列 网 络 P。 的 递归 构造 过 程 ， 其 中 使 用 了 两 个 相 
同 的 P 和 8 个 开关 。 开 关 的 状态 可 以 实现 排列 g= 《4, 7, 3, 5, 1, 6, 8, 2>， 而 它 又 递归 地 要 求 
上 面 的 P, 实现 排列 《4, 2, 3, 1?， 下 面 的 P, 实现 排列 《2, 3, 1, 4y。 

b. 说 明 如 何 实现 排列 网 络 Ps 上 的 排列 《5，3，4，6，1,，8，2，7>， 画 出 开关 的 位 置 状 
态 和 两 个 排列 网 络 P, 所 实现 的 排列 。 

设 n 为 2 的 宕 ， 用 与 定义 Ps 类 似 的 方式 用 两 个 P,，， 来 递归 地 对 P 进行 定义 。 

c. 描述 一 个 运行 时 间 ( 普 通 RAMD 为 O(n) 的 算法 ， 该 算法 可 以 对 了 中 连接 输入 和 输出 
的 n 个 开关 进行 置 位 ， 并 能 说 明 每 个 P。， 所 必须 实现 的 排列 ， 以 此 来 完成 任意 给 定 的 mn 个 
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元 崇 的 排列 。 证 明 所 给 出 的 算法 是 正确 的 

d.P, 的 深 庶 是 多 少 ? 规 模 有 和 允 大 ?用 阅 通 的 随机 存 取 计 算 机 (及 AM) 要 花 多 长 时 间 才 能 够 
计算 出 所 有 的 开关 喃 位 % 包 插 P。vz 中 的 开关 置 位 )。 

e. 让 出 : 对 n>2， 任 何 排列 网 络 (不 只 是 Pu 必须 通过 开关 置 位 的 两 种 的 连接 实现 某 一 
排列 . 


练习 二 十 八 


录 .11 给 定 一 -输入 译 列 <9，6，5，2> ， 说 明 轿 28.2 中 的 网 络 的 所 有 线路 上 出 现 的 值 。 

3 好 .1-2 设 n 为 2 的 等 ， 试 说 明 如 何 构造 一 个 具有 nm 个 输入 .mn 个 输出 且 识 度 汶 1gm 的 最 小 俏 且 底部 
的 输出 线路 总 静 输 出 最 大 的 输入 值 。 

28.1-3 有 人 声称 如 果 我 们 在 排序 网 络 中 任何 地 方 加 人 一 个 比较 回 ， 所 得 的 网 络 仍然 是 排序 网 络 。 试 
在 儿 ?8.2 所 二 的 网 络 中 加 人 一 个 比较 器 ， 使 所 得 的 网 络 不 能 对 每 个 条 人 的 排列 进行 排序 ， 以 此 灯 谤 明 这 种 
的 观点 芷 错误 的 . 

328.1-4 证 明 尾 何 上 共有 mm 个 输 大 的 排序 网 络 的 次 度 至 少 为 区 。 

28.1-5 证 明 任 何 排序 网 铬 中 比较 器 的 数 目 至少 为 Qinlg 站。 

28,t 一 6 攻 察 多 28.3 所 林 的 比较 网 络 。 证 明 它 实际 上 是 一 个 排序 网 络 ， 并 说 明 其 结构 和 插 人 排序 有 何 
联系 { 搬 人 排 华 见 第 1.1 节 )。 





中 加 汪汪 PP 


图 28.13 ”基于 练习 328.1-6 中 导入 排序 的 排序 网 络 


28.I-7 ”我 们 可 以 把 具有 C 个 比较 器 和 nm 个 输 大 的 比较 网 络 表 示 为 取 值 范围 是 从 1 到 mn 的 C 对 整数 组 
或 的 一 张 表 。 如 果 两 对 整数 中 包含 同一 个 整数 ， 则 在 网 络 中 相应 的 比较 器 的 排列 次 序 由 表 中 整数 对 的 次 序 
决定 。 给 出 这 种 表示 法 并 描述 一 个 运行 时 间 为 Qtn+o) 的 ( 申 行 ) 算 法 来 计算 比较 网 络 的 深度 . 

28.1-8 ”假定 除了 上 述 标准 类 型 的 比较 内 外 ， 我 们 引进 一 种 “其 倒 的 * 比 较 器 ， 这 种 比较 器 在 其 底部 线 
路 中 产生 最 天 输出 值 。 试 说明 如 何 把 由 C 个 标准 的 或 项 倒 的 比较 器 组 成 的 任意 排序 网 络 转换 为 仅 包含 CC 个 
标准 比较 器 的 排序 网 络 。 证 明 所 给 出 的 转换 方法 是 正确 的 。 


28.2-1 - 证 明 ; 把 一 个 单调 递增 函数 作用 于 一 个 排序 列 仍然 得 到 一 个 排序 序列 。 

28.2-2 证 明 : 兵 有 nm 个 输 和 人 的 比较 网 络 能 够 正确 地 对 输 人 序列 <n，m 呈 1，…，1> 进行 排序 ， 当 月 公 
二 E 个 呈 !1 序列 进行 排序 : <1，0，0，-…，0，0>，<1，1，0，…，1 0>， 
女 1，]，1，…，1， 心 > 。 

28.2 一 3 有 0-1 原则 证 明 图 28.14 4 让 所 示 的 比较 网 络 是 排序 网 乡 。 

28.2-4 对 判定 树 模型 阐述 并 证 明 与 叶 ]1 原则 类 似 的 结论 。( 提 示 :; 要 正确 地 处 理 等 式 ) 

如 .2-5 证 明 : 对 所 有 i=1，2，…，m1， 一 个 其 有 个 输 人 的 排序 网 络 的 第 1 条 线 与 第 计 !1 条 线 之 
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问 必 有 至少 有 -个 比较 器 。 


出 28.14 对 4 个 数 进 行 排序 的 排序 网 络 


28.3-1 存在 多 少 贞 0 和 1 组 成 的 双 调 序列 ? 

28.3-2 证 明 当 nm 为 2 的 和 戎 时 ，BITONIC-SDRTERfn] 包 售 呈 nlg 贡 个 比较 器 。 

28.3-3 说 明 当 输 人 数 nm 不 是 2 的 才 时 ， 如 何 构 造 一 个 深度 为 QIg ao) 的 双 调 排序 程序 ， 

28.3-4 如 果 某 半 清 竺 器 的 输 人 是 一 个 由 任意 数组 成 的 双 调 序列 ,证 明 输 出 端 满足 下 琳 性 质 ， 输出 的 上 半 
部 分 和 下 半 部 分 部 是 双 调 的 ， 上 面 半 部 分 中 的 每 个 元 素 至 少 与 下 面 半 部 分 中 的 每 个 元 素 一 样 小 . 

28.3-5 者 华 两 个 由 心 和 1 组 成 的 序列 。 证 明 如 果 其 中 的 每 个 元 素 一 样 小 ， 则 两 个 序列 中 有 一 个 序列 
基 清 洁 的 。 

28.3-6 证 明 下 列 与 0-1 原则 类 仆 的 关于 至 调 排序 站 阿 络 的 结论 : 一 个 能 对 任何 由 0 和 1 组 成 的 双 调 序 
别 进行 排序 的 比较 网 络 , 也 能 够 对 由 任意 救 组 成 的 任何 驱 调 序列 进行 排序 . 


28.4-t 对 上 上 合并 网 络 ， 证 明 一 个 与 0-1 原则 类 似 的 结论 ， 特别 地 ， 证 明 一 个 能 对 任何 两 个 由 0 和 1 
组 成 的 单调 递增 序列 进行 合并 的 比较 网 络 , 也 能 对 生 何 两 个 由 任意 数组 成 的 单调 递增 序列 进行 合并 ， 

28.4-2 归 抠 多 少 个 不 同 的 01 输 和 人 序列 作为 一 个 出 较 网 络 的 输入 才能 验证 该 圆 络 是 一 个 合并 网 络 ? 

28.4-3 证明: 全 何 能 把 1 与 nt 项 合并 以 产生 一 个 长 度 为 n 的 排序 序列 的 网 络 的 深度 至 少 为 ]n。 

28.4 一 4 着 察 一 个 输 人 为 扑 ，az，…，a 的 合并 网 络 ，n 为 2 的 寡 ， 其 中 包含 两 个 需要 合并 的 单调 序 
询 <ai，as， an 1 和 <a al，…，an>。 证 明 :; 在 这 种 合并 网 络 中 比较 器 的 数目 为 Rn lgm)。 

28.4-S* 让 明 : 不 论 输 人 次 序 如 何 ， 任 何 合并 两 络 都 需要 mn lg mo) 个 比较 器 。 


28.5 一 1 SCRTERIn] 中 有 多 消 个 比较 器 ? 

38.5~2 证 明 SORTERfo] 的 深度 恰好 为 (lg mnXlg n+D7 2。 

328.5-3 假定 我 们 对 比较 美 进行 修改 如 下 : 采用 两 个 长 度 为 z 的 排序 表 作 为 输入 ， 把 它们 的 合并 。 然 
拉 在 其 "最 大 值 " 输 出 端 输出 其 最 大 的 个 值 ， 并 在 其 “最 小 值 " 输 出 端 输出 其 最 小 的 个 值 。 证 明 : 任何 以 
这 种 方式 修改 后 的 比较 器 组 成 的 具有 nm 个 输入 的 排序 网 缁 可 以 对 nk 个 数 进行 排序 ， 我 们 倪 定 网 络 的 等 个 输 
和 人均 是 长 度 汶 k 的 一 个 有 序 表 。 

.5-4 仇 定 有 2n 个 元 宗 <ai，a， …，ai>， 我 们 看 望 把 该 序列 分 划 为 两 个 序列 ， 其 中 一 个 包 售 mn 
个 最 小 值 ， 另 一 个 包含 捍 个 最 大 值 。 证 明 : 在 分 别 对 序列 <a aa，…，a > 和 <a ay，…，a > 进 
行 排序 后 再 在 一 定 的 课 度 内 就 可 达到 上 述 要 求 . 

28.5-5+ 设 SK) 为 兵 有 个 输 人 的 排序 网 络 的 次 度 ，MIOGO 为 具有 全 个 输 和 人 的 合并 网 络 的 这 诬 。 恨 
证 我 们 要 对 一 个 而 nm 个 数组 成 的 序列 ， 进 行 排序 并 且 已 知 每 个 数 与 其 在 结果 序 珂 中 的 正确 位 置 相 差 不 超 过 
k 个 数 的 位 置 。 证 明 ; 能 够 在 深度 SCejH2MIG) 内 对 这 个 数 进行 排序 ， 

28.5-6*+ 可 以 通过 反复 执行 下 列 过 程 丰 次 来 对 一 个 血 x 冲 矩阵 中 的 元 素 进 行 排 座 : 

.把 妓 个 奇数 行 的 元 素 排 列 成 单调 递增 序列 ; 

2?. 把 租 个 偶数 行 的 元 冉 排 列 成 单调 递减 序列 ; 

3. 抠 每 列 元 素 排 列 成 单调 增 序列 。 

对 上 上述 排序 过 程 需要 进行 多 少 次 选 代 ? 其 排序 后 输 上 出 的 结果 麻 列 是 什么 样 的 模式 ? 


第 二 十 九 章 “算术 电路 


普通 计算 机 所 提供 的 计算 异型 都 假定 基本 的 算术 运算 -一 奶 法 、 减 法 、 乘 法 和 除法 -一 
能 够 在 常数 时 间 内 执行 。 这 一 抽象 是 合乎 情理 的 ， 因 为 在 随机 存 歌 计算 机 (RAMI 上 的 大 部 
分 基本 操作 的 代价 是 相 亿 的。 但是， 当 我 们 最 终 来 设计 实现 这 些 操作 的 电路 时 ， 却 会 发 现 其 
性 能 与 被 操作 数 的 大 小 有 关 。 例 如 ， 我 们 在 小 学 都 已 经 学 过 如 何在 人 @(n) 步 内 对 两 个 自然 数 ( 
表述 为 位 十 进 制 数 )} 进 行 相 加 ， 

本 章 要 介绍 执行 算术 运算 的 有 关 电 路 。 对 串 行 处 理 来 说 ， 对 两 个 m 位 数 相 加 所 能 获得 
的 渐 近 最 优 运行 时 间 为 @0m)。， 但 对 于 能 够 并 行 执行 的 电路 来 说 ， 我 们 能 够 得 到 更 佳 的 运行 
时 间 。 在 本 章 中 ， 我 们 将 设计 出 能 够 快速 执行 加法 和 乘法 的 电路 。( 减 法 实质 上 与 加 法 相 
同 。 对 于 除法 我 们 在 问题 29~-1 再 进行 讨论 。) 鼻 定 所 有 输入 均 为 nm 位 的 二 进 制 自然 数 。 

29.1 节 将 介绍 组 合 电 路 ， 我 们 将 了 解 到 电路 的 深度 如 何 对 度 于 其 “运行 时 间 ”。 我 们 把 
全 加 器 作为 绝 合 电路 的 第 一 个 例子 吉 以 说 明 ， 它 是 本 音 大 部 分 电路 的 基石 。29.2 节 中 介绍 
了 两 种 加 法 组 合 电路 : 运行 时 间 为 @(m 的 行 波 进 位 加 法 器 和 运行 时 间 仅 为 外 (lgJ 的 先行 进 
位 加 法 器 。 在 该 节 中 也 论述 了 保留 进位 加 法 器 ， 这 种 加 法 器 能 在 @() 的 运行 时 间 内 把 对 三 
个 数 求 和 的 问题 转化 为 对 两 个 数 求 和 的 问题 。29.3 节 中 介绍 了 两 种 组 人 台 乘 法 器: 运行 时 和 间 
为 刀 (的 阵列 乘法 器 和 运行 时 间 仅 为 @(lg 问 的 华 莱 士 树 (Wajliace-tree) 加 法 器 。 最 后 ，29.4 
节 中 介绍 了 含有 带 时 钟 的 存 情 单 元 (寄存 器 ) 的 电路 ， 并 说 明了 如 人 和合 通 过 使 用 组 合 电路 来 节省 
硬件 开销 . 


29.1 组 合 电路 


与 第 二 十 八 章 中 讨论 的 比较 网 络 相似 ， 组 合 电路 的 操作 也 是 并 行 的 ， 每 一 步 可 以 同时 计 
算 多 个 值 、 在 本 节 中 ， 我 们 将 给 出 组 合 电路 的 定义 ， 讨 论 如 何 由 基本 的 门 电 路 构造 天 规模 的 
组 合 电 路 . 


合 元 件 


实际 计算 机 中 的 运算 电路 都 是 把 组 合 元 件 用 线路 互相 连接 而 成 的 。 组 合 元 件 是 指 输入 输 
出 为 常数 且 能 执行 一 种 有 定义 的 函数 的 任何 电路 元 件 。 我 们 在 本 章 中 将 要 遇 到 一 些 布尔 组 合 
元 件 , 其 输 人 和 输出 都 属于 集合 {10，1}+， 其 中 0 表示 FALSE，1 表示 TRUE.。 

计算 简单 布尔 函数 的 布尔 组 合 元 件 称 为 迎 辑 站 图 29.1 说 明了 作为 本 章 中 组 合 元 件 的 
四 个 基本 门 电路 : " 非 “ 门 《或 反 相 器 ),“ 与 ? 门 , “或 " 门 和 * 异 或 " 门 。 每 个 逻辑 门下 是 其 真 值 表 
图 中 也 说 明了 其 他 两 种 门 电路 “与 非 * 门 和 -或 非 * 门 在 练习 中 将 要 用 到 这 两 种 门 电路 .“ 非 
门 仅 有 一 个 二 进 制 输入 x， 其 值 为 0 或 1， 结果 产生 的 二 进 制 输出 区 的 值 与 输入 值 相反 。 其 
他 三 种 门 电路 都 有 两 个 一 进 制 输 人 x 和 Yy 并 产生 一 个 二 进 制 输出 区 。. 
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图 29.1 输 人 加 输出 均 为 二 进 制 的 六 个 基本 还 辑 门 


每 个 门 或 任何 布 尔 组 侣 九 件 的 操作 均 可 以 用 真 值 表 摘 述 ， 如 图 29.1 所 东 。 真 值 表 给 出 
了 组 合 元 件 竺 种 可 能 的 输入 所 对 府 的 输出 。 例如 “ 异 或 " 门 的 真 值 表 告 诉 我 们 : 当 输 人 为 
x=0，y=1 时， 输入 值 j=41 该 门 电 路 对 其 两 个 输入 值 进行 “ 异 或 运算。 我 们 用 符 导 一 来 表 
示 " 非 "“ 琐 数 ， 六 表示 “与 " 画 数 ， 广 表示 “或 ?区 数 ， 中 表示“ 异 或 " 晒 数 ， 因 此 有 
0 也 1= 1. 

实际 电路 中 的 组 合 邢 件 并 非 立 即 操作 。 一 且 进 入 组 合 元 件 的 输入 秆 确定 ， 则 成 为 稳定 状 
碍 ( 即 科 定 地 保持 足够 长 时 间 ? 元 件 的 输出 值 在 一 段 固 定 的 时 间 后 必定 是 稳定 旦 正确 的 。 我 们 
称 这 一 时 间 差 手 为 元 件 的 传输 时 延 。 在 本 童 中 我 们 假定 所 有 组 合 元 件 的 传输 时 延 均 为 常数 ， 


组 合 电 路 


组 合 电路 由 一 个 或 多 个 以 无 回路 方式 相互 连接 的 组 合 元 件 组 成 。 组 合 元 件 中 的 连接 称 为 
线路 。 一 条 线路 可 以 把 一 个 元 件 的 输出 与 另 一 元 件 的 输入 相连 接 ， 从 而 把 第 一 个 元 件 的 输出 
值 作为 第 一 个 无 件 的 输 大 值 。 昌 然 对 一 条 线路 来 说 可 能 只 有 一 个 组 合 元 件 的 输出 与 其 相连 ， 
但 是 该 线路 却 可 以 作为 nm 个 元 件 的 输入 。 一 条 线路 馈送 的 元 件 的 输入 数 上 自称 为 该 线路 的 遍 
出 。 如 果 一 条 线路 不 与 任何 元 件 的 输出 端 相 连 ， 则 该 线路 是 电路 的 输入 ， 它 从 电路 外 部 的 谭 
接受 输 人 值 。 如 果 一 条 线路 不 与 任何 元 件 的 输 人 相连， 则 该 线路 是 电路 的 输出 ， 它 把 电路 计 
等 的 结果 提供 给 外 部 世界 (一 条 内 部 线路 也 能 对 电路 的 输出 扇 出 )。 组 合 电路 中 不 包含 回路 和 
记 近 元 件 ( 例 如 第 29.4 节 中 讲 到 的 寄存 器 )。 
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图 29.2 全 加 器 电路 


全 加 器 


作为 一 个 例子 ， 图 29.2 说 明了 一 个 称 为 全 加 器 的 组 合 电路 ， 该 全 加 器 有 三 个 输入 位 
xz，y 和 z 皇 根 据 下 列 真 值 表 输出 两 位 s 和 c: 





输出 s 是 输入 位 的 奇偶 校 验 著 数 : 
s 一 parity(x，y， 相 一 X 中 yz (29.1) 
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输出 < 中 输入 位 的 多 数 慑 辑 ( 函 数 ) ， 
ce 一 ITalority(x，y， 一 改作 YJV9AzwAz) (29.2) 

(一 般 来 说 ， 奇 倘 函 数 和 多 数 函 数 的 输 和 人 位 数 是 任意 的 。 奇 偶 函 数 为 1 当 且 仅 当 输入 中 
包含 村 数 个 1、 多 数 函 数 为 1 当 且 仅 当 多 于 一 半 的 输 大 位 为 1。) 注 意 ，c 位 和 s 位 合 在 一 起 
就 是 x，y 和 并 的 和 。 例 如， 如 果 x=1，y=0，z=1,， 则 <c，s> = <10>， 它 是 区 y 和 > 
的 和 2 的 -: 进 制 考 去 。 

输入 x，y， 和 了 中 每 一 个 对 全 加 器 的 扇 出 均 为 3。 当 一 个 组 合 元 件 执行 的 操作 对 其 输 人 
满足 交换 律 和 结合 律 时 (例如 函数 “与 "、“ 或 "和 * 异 或 ")， 称 输入 的 数目 为 该 元 件 的 扇 人 。 尽 
管 图 9.2 中 每 个 门 的 硼 和 人 均 为 2， 但 我 们 可 以 用 一 个 三 输 人 异 或 门 代替 异 或 门 A 和 下 ， 峙 
用 一 个 江 输 入 或 门 代 静 或 门 F 和 后， 从 而 重新 画 出 新 的 全 加 器 。 

为 了 了 解 全 加 器 的 操作 过 程 ， 我 们 假定 每 个 门 用 单位 时 间 进 行 操作 。 图 29.2(ay 说 明了 
在 时 刻 0 状态 稳定 的 一 组 输入 门 A-D 此 时 都 有 稳定 的 输入 值 ， 因 而 在 时 刻 1 产生 出 图 
29.2(b) 所 未 的 值 。 注 意 门 A-D 是 并 行 操作 的 。 门 E 和 下 在 时 刻 1 只 有 稳定 的 输 人 并 在 时 
纪 2 产生 出 图 29.2(c) 所 示 的 值 。E 的 输出 是 位 s， 因 此 全 加 器 可 以 在 时 刻 2 输出 位 s. 但 此 
时 和 输出 还 未 产生 。 门 G 最 终 在 时 刻 2 具有 稳定 的 输入 ， 因 此 在 时 刻 3 它 产 生 图 29.2(d) 所 
未 的 输 员 e。 


电路 深度 


了 第 一个 八 章 中 讨论 的 比较 网 络 类 似 ， 我 们 根据 从 输入 到 输出 的 任意 路 径 中 组 合 元 件 的 
最 大 歼 上 日 米 衡量 组 合 电路 的 传输 时 延 。 特 别 地 ， 我 们 根据 构成 它 的 线路 的 深度 来 定义 一 个 电 
路 榴 深 度 ， 它 对 应 于 电路 最 址 情况 下 的 “运行 时 间 "。 输 人 线路 的 深度 为 0、 如 果 组 合 元 件 的 
和 输入 xi，xa，…，xu 的 深度 分 别 为 由 ，d，…，d， 则 它 的 输出 深度 为 maxfd ，d，. 
dt+1， 组 合 元 件 的 深度 就 是 其 输出 的 深度 。 组 合 电路 的 深度 是 其 中 任何 组 合 元 件 深 度 的 最 
大 值 ， 因 为 我 们 禁止 组 合 电路 中 包含 环 路 ， 所 以 各 种 深度 的 概念 都 有 完备 的 定义 。 

如 果 每 个 组 合 元 件 计 算 其 输出 什 所 需 时 间 为 常数 , 则 通过 一 个 组 合 电路 的 最 乓 情形 下 的 
传输 时 延 与 其 深度 成 正比 。 图 29.2 说 明了 全 吉 器 中 每 个 门 的 深度 。 因 为 共有 最 大 深度 的 门 
征 门 G， 所 以 全 加 器 的 深度 为 3， 且 与 电路 在 最 坏 情 形 下 执行 其 函数 需要 的 时 间 成 正比 。 

有 时 组 合 电路 计算 的 速度 要 快 于 其 深度 。 假 设 一 个 大 规模 子 电 路 馈送 其 输出 作为 两 输 人 
“了 门 的 一 个 输入 ， 但 该 与" 门 的 另 一 个 输入 为 0， 则 该 门 的 输出 必 为 0， 而 与 从 大 规模 子 
电路 得 到 的 输入 无 关 。 但 一 般 说 来 ， 我 们 不 能 预计 电路 的 特定 输入 ， 因 此 把 电路 的 “运行 时 
间 "抽象 化 为 其 深度 是 比较 合理 的 。 


电路 规模 


除了 电路 深度 以 外 ， 在 设计 电路 时 我 们 还 非常 希望 获得 另外 一 种 资源 的 最 小 值 . 组 合 电 
路 的 规模 是 指 它 包含 的 组 合 元 件 的 数目 。 直 观 上 看 ， 电 路 规模 对 应 于 算法 占用 的 存储 器 空 
间 。 侈 如 ， 因 为 图 29.2 的 全 加 器 使 用 了 ?7 个 门 ， 所 以 其 规模 为 7。 

电路 规模 的 定义 对 于 小 规模 的 电路 并 非特 别 有 用 。 因 为 全 加 器 有 恒定 的 输入 和 输出 并 能 
计算 一 个 有 完备 定义 的 函数 ， 所 以 它 满足 组 合 元 件 的 定义 ， 这 样 由 单个 的 全 加 器 组 合 元 件 构 
成 的 全 加 器 的 规模 就 是 1， 事实 上 ， 根 据 这 一 定义 ， 任 何 组 合 元 件 的 规模 均 为 1。 
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我 们 定义 电路 规模 是 希望 把 它 应 用 于 计算 相似 函数 的 电路 族 。 例 如 ， 我 们 不 久 将 看 到 具 
有 两 个 n 位 输 和 人 的 一 个 加 法 电路 。 实 际 上 ， 我 们 在 此 讨论 欧 并 不 是 单个 的 电路 ， 而 是 一 个 
电路 族 一 一 每 种 输 人 规模 对 应 于 一 个 族 。 在 这 一 前 担 王 ， 电 路 规模 的 定义 就 有 着 重要 的 意 
义 ， 它 使 我 们 能 够 方便 地 定义 电路 元 件 ， 而 对 电路 的 实现 规模 的 影响 不 会 大 于 一 个 常数 因 
子 。 当 然 ， 在 实际 应 用 中 ， 电 路 的 规模 衡量 要 复杂 得 多 ， 其 中 不 仅 涉及 组 合 元 件 的 选择 ， 还 
涉及 在 芯片 上 集成 时 电路 所 需要 的 面积 等 。 


29.2 吉 法 电路 


我 们 现在 来 讨论 对 二 进 制 数 进行 相 加 的 问题 。 我 们 将 介绍 解决 这 一 问题 的 三 种 组 合 电 
路 。 首 先 我 们 来 君 看 行 波 进 位 加 法 ， 这 种 加 法 电路 的 规模 为 @@(n)， 它 可 以 在 @@(m 的 运行 时 
间 内 对 两 个 n 仔 位 数 进 行 相 加 。 运用 先行 进 亿 加 法 器 可 以 改进 其 运行 时 间 为 DO(1g 四， 改进 
后 的 电路 规模 仍然 是 @(nj。 最 后 讨论 保留 进位 加 法 ， 这 种 加 法 器 可 在 DG) 的 运行 时 间 内 把 
三 个 na 位 数 的 和 转化 为 一 个 na 位 数 与 一 个 n+l 位 数 的 和 。 电 路 规模 为 日 m。 


29.2.1 行 波 进位 加 法 
我 们 从 二 进 制 数 求 和 的 普通 方法 开始 。 假定 一 个 非 负 整 数 a 用 一 个 na 位 的 二 进 制 序 


列 : <a_ li，a，…，ao> 表示 ,其 中 mz 「lg(a+lD 1， 且 : 
sa Zai2 
已 知 两 个 n 位 数 = <a ii，a 2，…，ao> 和 b=<b _i，b >，…，bo>， 我 们 希望 求 
出 其 ntl 位 的 和 s= <s，sS 1 …，s>。 图 29.3 说 明了 两 个 8 位 数 相 加 的 实例 。 我 们 从 
右 癌 左 进行 求 和 ， 同 时 把 第 1 列 的 进位 传输 给 第 计 ]1 列 ，i=0，1，…，an-1. 在 第 i 位 位 置 


上 ， 把 位 a，bi 和 进位 s 作为 输入 ， 并 产生 和 位 s 和 出 进位 cr。 在 第 i 位 置 的 出 进位 cr 
就 是 第 it1 位 位 置 上 的 人 进位 。 因 为 0 位 置 上 没有 人 人 进位， 所 以 我 们 设 wa=0。 出 进位 c 是 
和 中 的 位 s,。 
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图 29.3 两 个 8 位 数字 a 和 bb 相 加 ， 产 生 一 个 5 位 数 的 和 


注意 ， 每 个 和 位 8 是 位 站 ，bi 和 的 奇偶 校 验 函数 ( 砚 等 式 (29.1))。 此 外 ， 出 进位 ec 
是 ai、bi; 和 ci 的 多 数 盯 数 ( 见 等 式 (29.2)。 因 此 加 法 中 的 每 一 步 都 可 以 用 全 加 器 来 实现 。 

一 个 了 位 行 波 加 靶 器 是 个 全 加 器 FAo，FAI，FA,，…，FA ;组 成 的 级 联 ， 其 中 
FA 的 出 进位 ct 直接 作为 FA 的 人 进位 输入 。 图 29.4 说 明了 一 个 8 位 行 波 进位 加 法 器 。 
进位 如 波浪 一 样 从 右 向 左 传输 。FA, 的 人 进位 Co 被 硬 连 线 为 6， 即 不 论 其 他 输入 值 是 多 少 
它 总 是 0。 输 出 是 一 个 n+1 位 数 8S= 人 3,，3，，…， 操 )， 其 中 S =C， 是 全 加 器 FA_ 的 贞 





图 29.4 ”执行 图 29.3 中 训 法 的 8 位 行 泪 进位 加 法 器  ， 


因为 进位 波 经 所 有 个 全 加 器 ， 所 以 na 位 行 波 进 位 加 法 器 所 需 的 运行 时 间 为 昌 n)， 重 
精确 地 说 ， 全 加 器 FA 在 电路 中 的 深度 为 寺 1。 因 为 FA ,在 电路 的 全 加 器 中 深度 最 大 ， 所 
以 行 恋 进位 加 法 器 的 深度 为 na。 因为 电路 中 包含 个 组 个 元 件 ， 所 以 其 规模 为 加 ny。 


29.2.2 ”先行 进位 加 法 器 


咖 


行 波 进 位 加 法 需要 @n) 的 运行 时 间 是 因为 进位 波 行 整 个 电路 。 先 行进 位 如 法 通过 运用 
树 形 电路 加 速 了 进位 的 计算 ， 从 而 避免 了 这 一 @(m) 的 时 间 延 迟 。 一 个 先行 进位 加 法 器 可 以 
在 O(IgI 的 运行 时 间 上 内 求 出 两 个 n 位 数 的 和 。 

在 行 波 进位 加 法 中 ， 我 们 所 观察 到 的 一 点 是 ， 对 iz 1， 全 加 器 FAi; 的 两 个 输入 值 ， 即 a 
和 tx 远 在 进位 5 就 绪 之 前 就 已 要 处 于 就 绪 状 态 。 先 行进 位 加 法 器 的 思想 就 是 利用 上 述 们 
息 。 

例如 ， 设 ai=b-l。 由 于 出 进位 ai 是 多 数 函 数 ， 所 以 不 论 人 进位 e_， 的 值 如 何 ， 我 们 
都 有 cs= ai-=b-i。 如 果 ar-;=bi =0， 则 我 们 可 以 通过 使 e 为 0 截断 出 进位 ci 而 不 必 等 待 
cr-l 的 值 计 算出 。 同 样 ， 如 果 ai=bh_ =1， 则 我 们 也 不 论 ec._; 的 值 如 何 ， 就 可 以 生成 出 进 
位 上 = 1。 

但 是 ， 如 果 a-t 夫 bi-， 则 aa 的 值 取决 于 c- 的 值 。 特 别 地 有 e=ec_,， 这 是 因为 人 进位 
cr-i 在 决定 c 值 的 多 数 选 举 中 握 有 决定 性 的 “一 票 "。 在 这 种 情况 下 ， 由 于 出 进位 等 于 人 进 
仔 ， 所 以 我 们 仅仅 传播 进位 。 

图 29.5 用 进位 状态 总 结 出 了 上 述 这 些 关系 ， 其 中 区 是 “截断 进位 ",g 是 “生成 进位 *，P 
是 “传播 进位 ". 





尼 生 站 YY 有 1 
恬 人 必 攻 - 
心 1 人 一 了 P 
心 全 -1 P 
1 | 1 区 


图 29.5 出 进位 s 和 进位 状态 


我 们 把 两 个 连续 的 全 加 器 FA_; 和 上 Ai 放 在 一 起 作为 一 个 组 合 单元 来 考察 。 该 单元 的 人 
进位 是 s-,， 其 出 进位 是 ct。 我 们 可 以 把 这 一 组 合 单元 的 传播 进位 ， 截 断 进 位 和 生成 进位 
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与 单个 全 加 器 的 情形 同样 看 待 。 如 果 FA; 截断 其 进位 , 或 者 如 果 FA，, 截断 其 进位 且 FA; 传 
播 其 进位 ， 则 该 组 合 单元 截断 其 进位 。 类 似 地 ， 如 果 FA; 生成 进位 , 或 如 果 FA;,_, 生成 进位 
并 且 FA; 传播 其 进位 ， 财 该 组 合 单元 生成 其 进位 。 如 果 两 个 全 加 器 都 传播 进位 ， 则 该 组 合 
单元 也 传播 进位 ， 置 cl=c-i。 图 29.6 中 的 表 总 结 了 全 加 器 并 置 时 其 进位 状态 的 各 种 组 
合 。 我 们 可 以 把 这 张 表 看 成 在 上 域 {k，p， 中 上 的 进位 状态 运算 符 四 的 定义 。 这 个 算 符 的 一 
个 重要 性 质 是 满足 结合 律 ， 练 习 29.2--2 将 槛 求 验 王 这 一 性 质 。 





图 29.6 全 加 器 下 Ai ,和 FAi; 连接 后 的 进位 状态 


我 们 现在 可 以 根据 输入 用 进位 状态 运算 符 来 表示 每 个 进位 6。 我 们 先 定义 如 =K， 并 且 
对 1=1，2，…，Dn， 


k 若 ai ， 一 b_ ,一 0 
X， 一 1 了 若 aj_ | 天 b,_， (29.3) 
多 者 ai 1 一 bi_i=1 


内 此， 对 i=1i，2，…，n，z 的 值 是 图 29.5 中 给 出 的 进位 状态 。 
某 指定 全 加 器 FAi-; 的 出 进 亿 6 依赖 于 每 个 全 加 器 FA =0，1，…，1 的 进位 状 
态 。 定 交加 =z=、， 并 且 对 i= 1，2，…，nma， 有 : 
yi 一 包罗 xi (29.4) 
一 X 国 xx 国 … 四 大 
我 们 可 以 把 W 看 作 是 妈 铝 xi 加 Go 的 “前 辍 *”， 把 计算 值 wm，yYi，…， 六 的 过 程 称 为 
前 辍 计算 (第 三 十 章 讨 论 了 更 一 般 的 并 行 条 件 下 的 前 辍 计算 问题 }， 图 29.7 说 明了 对 应 于 图 
29.3 中 的 二 进 制 加 续 的 环 和 六 的 值 。 
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图 29.7 对 序 于 图 29.3 二 进 制 加 潜 中 的 值 ai，bi 和 6 的 值 和 和 ii 一 各 1…,8 


下 列 引 理 指出 了 的 值 对 于 先行 进位 加 法 的 重要 性 。 
引 理 29.1 根据 等 式 (29.3) 和 (29.4) 定 义 09 下 9 xn 利 YY0， YI 9 Yo 对 1=0， 
1，…，n， 下 列 条 件 成 立 : 


一 433 一 


1.Y=k 草 含 c=n0 

2.yi 一 g 克 含 a=1 

3.Y=p 不 会 出 现 

证 明 : 对 i 进行 归纳 。 基 础 是 i=0， 根 据 定义 有 旭 = 台 =k， 且 co=0。 下 面 进 行 妆 纳 ， 
假设 对 三 1 引 理 成 立 。 根 据 的 值 我 们 分 以 下 三 种 情况 来 讨论 : 

1. 如 果 让 =k， 则 因为 W%=y_iG@x， 所 以 图 29.6 中 的 进位 状态 运算 符 @@ 的 定义 昔 含 或 者 
xi=kxk 或 者 %=pb 上 且 yi=k。 如 果 xi=k， 则 等 式 (29.3) 蔓 含 a_=b-=0， 拓 此 
ci 一 majcrity(a_i，bil， cuD=0。 如 果 现 =p 且 yi=k， 则 ai 夭 b ， 并 县 由 归纳 可 知 
ci=0。 因 此 majority(a 1，b_，G-D)=0， 所 以 总 =0。 

2. Wi=g， 则 或 者 有 国 =g， 或 者 有 轴 = 昌 且 -it=g。 如果 %=b 且 yi 一 8， 则 ai-1 去 
b ,，、 并 且 由 归纳 可 条 ci=1， 这 昔 售 ci= 1. 

3. 如 年 YX=pb， 则 图 29.6 瘟 含 YI=p， 这 与 归纳 假设 相 矛 大。 

引 理 29.1 绚 仿 我 们 可 以 通过 计算 每 个 进位 状态 六 来 计算 出 每 个 进位 ce。 一 旦 计算 出 所 
有 的 进位 ， 我 们 就 可 以 对 i=0，1，… 和 na 并 行 地 计算 出 和 位 s=parityfal，b，cjfa =b 一 人)， 
以 在 BUDD) 的 运行 时 间 求 出 两 个 数 的 和 。 因 此 ， 快速 对 两 个 数 相 加 的 问题 就 转化 为 对 进位 状 
态 nm，yYi，…，y 的 前 辍 计算 问题 。 用 并 行 的 前 辍 电路 来 计算 进位 状态 : 

与 逐次 产生 输出 的 行 波 进位 电路 棚 反 ， 我 们 通过 使 用 并 行 操作 的 前 轰 电 路 就 能 够 更 快 地 
计算 出 所 有 nm 个 进位 状态 yy，y，…，ya。 我 们 将 特别 设计 出 一 个 深度 为 O(jg ao) 的 并 行 前 
轻 电 路 。 该 电路 规模 为 日 (n)， 从 渐 近 痘 义 上 说 与 行 波 进位 加 法 器 使 用 的 硬件 数量 相同 。 


司 如 【0 
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图 29.8 ”并行 前 弧 电 族 的 结构 


在 构造 并 行 前 辍 电路 之 前 ， 我 们 先 介绍 一 种 表示 方法 以 帮助 我 们 理解 电路 的 操作 机 理 ， 
一 456 一 


对 满足 0 委 i 么 js 委 nm 的 整数 1 和 j， 我 们 定义 
下 ， 让 = Xi 的 矶 

因此 ， 册 于 仅 含 一 个 进位 状态 5 的 组 合 就 是 其 本 身 ,: 所 以 对 i=0，1，.…，m 我 们 有 
如 下 等 式 成 立 : 

6， 让 =G， 放 Hai，kx] (29.5) 
这 是 由 于 进位 状态 运算 符 席 足 结 合 律 ， 则 根据 这 种 表示 法 ， 先 辍 计算 的 目标 就 是 计算 
人 一 [oo，、 于 ,ii=0，1，…，n。 

在 并 行 前 辍 电 路 中 使 用 的 唯一 组 合 元 件 是 用 于 实现 因 运 算 符 的 电路 。 图 29.8 说 明了 如 
何 安排 各 对 @@ 元 件 以 形成 一 栋 完 全 二 又 树 的 内 部 结 点 。 图 29.9 举例 说 明了 一 个 n=8 的 并 行 
先 缀 电路 。 (ta] 整个 电路 的 结构 。 (b) 对 应 于 图 29.3 和 图 29.7 中 秆 的 同一 条 电路 。 注 意 ， 
电路 中 的 线路 形成 一 棵 树 形 结构 ， 但 尽管 电路 纯粹 是 组 合 电路 ， 它 自身 并 不 是 树 。 输 和 人 
xi，xX2，…，xXu 由 时 子 提 供 ， 输 入 区 由 根 握 供 。 输 出 癌 ，Y，…， ;由 时 子 产生 ， 输 出 交 
由 根 产生 。 (为 较 容 易 地 和 弄 懂 前 锻 计 算 ， 与 本 节 中 其 他 图 的 变量 下 标 从 右 向 左 递增 的 情况 相 
反 ， 图 29.8 和 29.9 中 的 变量 下 标 从 左 向 右 递 增 。) 


f 
Xi 108 [1 省] 


-一 一 人 


雹 ,0 1 4| 


10.0| 湖 上 ,41 
< 15| 一 
OA NS 2 SS 
(| 2 1334] 泛 ( [So 17 着 | ) 


【| ID 10.21 [0.3| 10.4] 10.5| 10.6] 10,7] 


本 守 | [3,.3】 时 .4] 15.5] 下 6, 台 | 人 77 反 必 ] 
0 1 Aa 2 OA X4 J3 5 Ao 2 .36 上 6 了 


《0 


二 
< 一 
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(b) 
图 29.9 相应 于 mn=g 的 并 行 前 变 电 路 


每 个 结 点 中 的 两 个 名 元 件 在 完全 不 同 的 时 间 进 行 操作 且 在 电路 中 具有 不 同 的 深度 。 如 图 
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29.8 所 示 、 如 果 以 某 指 定 结 点 为 根 的 子 树 生成 某 域 石 ，x，…， 玉 中 的 输 人 ， 它 的 左 子 树 
生成 域 x，xrau …， 3 并 且 其 右 子 树 生 成 域 而 ， 有 9， …， 了 xx， 则 结 点 必 能 为 其 父母 结 点 
产生 其 子 树 生成 的 所 有 输入 的 积 [i，z 妇 。 根 据 归 纳 ， 我 们 可 以 息 设 该 结 点 的 左右 子女 产生 积 
[， 记 JJ 和 [，k]、 所 以 充 用 该 结 点 中 的 一 个 元 件 就 能 计算 出 fi ki， 生 1]Jeo0， 匡 。 

在 这 种 向 上 计算 过 程 后 的 某 个 时 刻 ， 该 结 点 从 其 父母 结 点 接收 到 在 它 生 成 的 最 左 结 点 瑟 
到 达 之 前 的 所 有 输入 之 积 0，1。 现 在 该 结 点 也 同样 为 其 子女 计算 值 。 由 该 结 点 的 左 子 女 
生成 的 最 左 输入 也 是 x5， 因 此 它 把 值 0，1] 待 递 给 其 左 子 女 。 该 结 点 的 右 子 女生 成 的 最 左 
输入 是 x， 因 此 它 生 成 [0、 广 1j。 因 为 该 结 点 从 其 父母 接收 到 值 中 ， 记 ] 并 从 其 左 子女 接收 到 
值 [6 因此 它 只 是 计算 [0， 认 1 名， 记 寺 fi， 菇 并 把 该 值 送 到 其 右 子 女 。 

图 29.9 说 明了 生成 的 电路 ， 其 中 包括 出 现在 根 结 点 的 边界 情形 。 什 xo= 上 四，0]， 为 输 人 
提供 给 根 结 点 ， 并 且 没 有 再 运用 任何 名 元件 来 计算 值 rn=[0，a=10，0ofL， 可 。 

如 果 是 2 的 寡 ， 则 并 行 前 辍 电路 中 使 用 了 2n-1 个 @@ 元 件 ， 因 为 计算 过 程 先 沿 树 向 上 
进行 然后 又 返回 向 下 进行 ， 所 以 计算 出 全 部 n+l 个 前 辍 仅 需 DC 切 的 运行 时 间 。 练习 
29.2 一 5 中 更 详细 地 讨论 了 电路 的 这 度 。 


完成 先行 进位 加 法 器 的 构造 


在 有 了 并 行 前 狗 电 路 后 ， 我 们 就 可 以 完成 对 先行 进位 加 法 器 的 描述 了 。 图 29.10 说 明了 
其 构造 ， 一 个 m 位 先行 进位 加 法 器 由 n+] 个 全 PG 框 (每 个 框 的 规模 为 @@(D) 和 一 个 输入 为 
x0，xl，…，xn(xo 被 硬 连 线 为 k)， 输 出 为 yy，7i，…， 态 的 并 行 前 锋 电 路 构成 . 


Parallel Pre 丰 ix Circuit 


和 上 二 出 二 几 | 本 二 


几 29.10 mn 位 超前 进位 加 法 器 的 结构 ,nm = 


KPG 框 KGP| 有 外 部 输入 ai 和 让 并 产生 和 位 S。( 输 入 位 aa 和 bs 被 硬 连 线 置 为 0。) 
如 果 已 知 ai , 和 -1， 框 KGP; 根据 等 式 (29.3) 计 算出 天 6 丰 ，g，bp 并 把 该 值 作 为 并 行 前 辍 电 
路 的 外 部 输入 x。 (x+ 的 值 被 忽略 。) 计 算出 全 部 的 五 需要 B() 的 时 间 .。 径 过 O(L1g 区 的 延 
退 以 后 ， 并 行 前 辍 电路 产生 wm， 让，…， 太 。 根 据 引 理 29.1， 轴 只 能 是 k 或 g， 而 不 可 能 是 
p。 每 个 值 y 表示 在 行 波 进位 加 法 中 全 加 器 FAi; 的 人 进位 : Yi=k 说 明 上 =0， 页 =E 说明 
ci=1。 因 此 把 yW 的 值 饥 送 给 KGP; 是 作为 其 人 进位 c， 并 且 可 在 常数 时 间 内 产生 和 位 
Si= parity(au，ai，c)。 因 此 ， 先 行进 位 加 法 绒 的 运行 时 间 为 D(1g 要 ， 规 模 为 日 (n)。 
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29.2.3 保留 进位 加 法 


先行 进位 磺 法 莫 可 以 相 QtEIo 的 运行 时 间 肉 对 两 个 n 位 数 相 如。 该 者 可 能 感到 居 讶 的 
是 、 对 二 个 mn 位 数 进 行 相 加 羽 需 再 增加 常数 的 运行 时 间 。 其 中 的 奥妙 在 于 把 三 个 数 相 加 的 
问题 转化 为 两 个 数 相 加 的 问题 。 ， 
已 知 三 个 下 位 数 庆 二 和 三 
zi， …、zo>， 保 留 进位 加 法 露 产生 一 个 mn 位 数 n= <u_i，uw >，…; um> 和 一 个 n+l 位 
数 v= <v vi，…，vo>， 满足 : 
UL 二 TY 一 其 十 Y 十 Z 

如 图 29.11( 的 所 未 、 对 i=0，1，…，n 一 1， 它 计算 : 
ui 一 Parity(xi， 交 Zi) 
YN 三 majority(xi，7，) 


位 ww 总 是 为 0。 

837 了 76554321 0 
DODlIl1L0Ot = 攻 
Ll10080101=》 
II0U0t0l1lDas 3 
一 贞 
. 怕 二 

{) 





2 加 好 


仙 ) 
图 29.11 保留 进位 加 法 器 


图 29.11(b) 所 示 的 nm 位 保留 进位 加 法 器 由 个 全 加 器 下 A,，FAI，…, 王 A，, 组 成 。 对 
=0，1，…，n-1， 全 加 器 FAi 把 二 ， 员 ， 五 作为 输入 。 FA 的 和 位 输 岂 作为 由 ，FAi 的 出 
并 位 作为 li。 位 w 厨 连 线 为 0。 

所 有 2n+1 个 输出 位 的 计算 过 程 是 相 卫 独立 的 ， 可 以 并 行 地 执行 。 因 此 ， 保 留 进位 加 法 
路 的 运行 时 间 为 @(1)， 规 模 为 日 (m。 为 了 对 三 个 位 数 进 行 相 加 ， 仅 需要 用 @@() 的 时 间 执 
行 保 留 进 们 加法， 再 用 Qtg 器 的 时 间 执 行 先 行进 位 加 法 。 从 渐 近 意义 上 来 说 ， 这 种 方法 尽 
管 比 不 二 使 用 两 个 先行 进位 加 法 的 方法 ， 但 在 实际 运用 中 前 者 运行 速记 要 快 得 移 。 此 外 ， 在 
2.3 节 中 我 们 将 要 看 到 保留 进位 加 法 对 有 关 和 滋 法 的 快速 算法 级 为 重要 . 


29.3 ”乘法 电路 


图 29.12 中 的 “小 学 "乘法 算法 可 以 计算 出 两 个 mn 位 数 a= <a_i，a_ ，，…，a> 和 
b= <be_ tu bu，…，bo> 的 2n 位 的 积 p= <poo_l， pz …，po> 。 我 们 从 bo 到 b，! 考 
察 b 的 各 个 数位 。 对 每 个 值 为 1 的 位 bi， 把 a 向 左 移 1 位 后 和 积 相 加 。 对 每 个 值 为 如 的 位 
bi， 铅 积 中 加 上 0.。 设 m =a - tb- 2， 计算 ， 
= 一 ab= im 


i 到 心 


每 个 项 ma 称 为 部 分 积 。 总 共 要 对 nm 个 部 分 积 进 行 相 加 ， 数位 从 位 置 0 到 2n--2。 最 高 
位 产生 的 出 进 例 形成 位 置 2n-1 上 的 最 后 一 位 数 。 
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图 29.12 “小 学 里 学 过 的 乘法 方法 


在 本 节 中 ， 我 们 将 考虑 两 种 对 两 个 n 位 数 相 乘 的 电路 。 阵 列 笋 法 器 的 运行 时 间 为 
em)， 其 规模 为 etn3。 华 菜 士 树 乘法 器 的 规模 也 是 @(n3， 但 其 运行 时 间 为 B(g 问 。 两 种 
电路 的 基础 都 是 小 学 乘法 算法 。 


29.3.1 ”阵列 乘法 恤 


从 概念 上 讲 ， 阵 列 乘法 器 由 三 个 部 分 构成 。 第 一 部 分 形成 部 分 积 。 第 二 部 分 运用 保留 进 
位 如 法 器 对 部 分 积 求 和 。 最 后 ， 第 三 部 分 或 者 用 行 波 进位 加 法 器 或 者 用 先行 进位 加 法 器 对 从 
保留 进位 加 法 得 出 的 两 个 数 进 行 相 如 。 

图 29.13 说 明了 关于 两 个 输 和 人 数 有 呈 一 女 3 1， an 2 和 > 和 b= <b ii，b >，…， 
bu> 的 一 个 阵列 乘法 器 ， 一 个 值 从 垂直 方向 输入 ， 另 一 个 值 从 水 平方 向 输入 。 每 个 输入 位 扇 
出 到 n 个 “与 " 门 以 形成 部 分 积 。 被 组 织 或 保留 进位 加 法 器 中 的 全 加 区 对 部 分 积 求 和 。 最 后 
积 中 的 发 位 部 分 在 右边 输出 。 我 们 把 最 后 一 个 保留 进位 加 法 器 输出 的 两 个 数 相 加 就 形成 最 后 
积 的 高 位 部 分 . 

让 我 们 更 细 歼 地 研究 一 下 阵列 梯 法 器 的 结构 。 对 于 给 定 的 两 个 输 和 人数 a=<a_ 1i，a 

，ao> 和 b= <b_， bo，…，bo>， 容 易 计 算出 部 分 积 的 各 位 。 对 1i，j=0，j1，…， 
Ti 一 1 ， 我 们 有 


mm 一 号 b，. 


直 于 1 位 数 的 积 可 以 直接 用 < 与 门 计算 ， 所 以 用 nm- 个 “与 " 门 进 一 步 就 可 以 产生 部 分 积 


一 下 昌 ( 一 


中 的 所 有 位 (除了 那些 为 0 的 位 显然 不 需要 计算 )。 
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图 29.13 ”阵列 入 法 器 


轩 29.14 说 明 阵 列 乘法 器 如 何 用 保留 进位 加 法 对 图 29.12 中 的 部 分 积 进 行 求 和 运算 。 开 
始 它 用 保留 进位 加 法 对 mo，mt 和 0 相 加 ， 产 生 一 个 nmHL 位 数 uD 和 一 个 n+] 位 煞 YD( 数 v 
只 有 n+l 位 而 不 是 nt2 位 ， 这 是 因为 0 和 mi 的 第 mtl 位 都 是 0。 因此 ， 


meo+Hmnt 一 moOHv0， 然后 再 用 保留 进位 加 法 对 uD、vD 和 me 相 加 ， 得 到 一 个 n+2 位 数 u2 
和 一 个 n+2 位 数 v2( 此 时 v@ 同 样 只 有 n+2 位 ， 这 是 因为 um 由 和 v 都 是 份 ， 于 是 我 们 有 


nm 十 了 口 十 之 


metHmHmeo=uo+v2。 乘 法 如 此 进行 下 去 ， 用 保留 进位 加 法 对 urD、vwG0 和 me 进行 相 
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吉 ，i=2，3，.…，Dn-~1， 结果 得 到 一 个 2n-1 位 数 ue 和 一 个 2n 一 1 位 数 ve-0， 其 中 


-bb ， um- An ， 器 
U 十 Y 一 人》 It 
1 十 几 


= 

事实 上 ， 图 29.14 中 的 保留 进位 加 法 无 需 对 这 人 么 多 位 进行 操作 ， 图 中 a= <1110>, 
- < 1101 > 。 观 察 一 下 对 i= 1，2，…，n 一 1, j=0，1，…，i 一 1， 我们 有 m， ~0. 这 
是 由 于 对 部 分 积 移 位 造成 的 ， 同 时 注意 ， 对 i=1，2，…，n 一 1 和 j=0，1，…，i ij 
+n.、i+n+1l …，2n 一 1， 有 Vv =0( 虽 练习 29.3 -- D)。 因 此 ， 每 个 保留 进位 加 法 仅 需 
对 nm 一 1 位 执行 操作 。 
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图 29.14 通过 重复 执行 保留 进位 加 法 来 求 部 分 积 的 和 


更 在 让 我 们 来 讨论 阵列 乘法 器 与 反复 进行 的 保留 进位 加 法 方案 之 间 的 对 应 关系 。 每 
个 “与 ” 门 由 G9 标示 ， 其 中 0<isn 一 1， 0<js2n 一 2。 门 G) 生成 第 i 个 部 分 积 的 
第 j 位 四 日。 对 于 i= 0，!1，…，n 一 1，“ 与 " 门 阵列 的 第 i 行 计算 出 部 分 积 站 @ 的 几 个 有 
效 位 ， 即 <mw mt， 0 mi > 。 


除了 项 上 第 一 行 中 的 全 加 器 以 外 ( 即 对 i= 2，3，…，a 一 D， 每 个 全 加 器 FA 有 三 个 
输入 位 ， mo，uf 0” 和 Y' ,并 产生 两 个 输出 位 u 和 Y),( 注意， 在 最 左 一 列 全 加 器 


j 
中 ut 一 mu  ，。)。 顶 上 第 一 行 中 每 个 全 加 器 FA 有 三 个 输 人 mi mi; 和 0 并 产生 
输出 位 和 四 ， 


js 


最 后 ， 让 我 们 看 看 阵列 乘法 加 的 输出 。 正 如 我 们 上 面 所 看 到 的 ve -2，j 一 0，1，…，n 


,0 


-1. 因此 ,9 一 ae =-0，1，…，n 一 1。 此外， 由 于 mm。 一 0， 所 以 我 们 有 nu 
= mm 。 又 由 于 每 个 mm 和 v9 ”的 最 低 i 位 都 蚌 0， 所 以 我 们 有 ui 一 ui ，，i 


-2，3，…，n 二 1, j=0，1，…，i 一 1。 困 此 ，p = mo， 并 且 由 归纳 可 知 了 | 一 ui ，i 


=2，3，… mn 一 上 最 后 由 一 个 na 位 加 法 器 把 最 后 一 行 全 加 器 的 输出 相 加 就 得 到 积 中 的 各 
位 <Pam_t pa -2 …， 中。 : 


入 pan 1， 叫 20 2， P,， 全 一 


分 析 


在 阵列 乘法 器 中 ， 数 据 从 左上 方 到 右 下 方 经 过 整个 乘法 器 。 计 算 积 的 低位 <po 
pb ，…、Ppo> 需要 @(m) 的 运行 时 间 ， 为 使 如 法 器 的 输入 就 绪 需 要 @@(m 的 运行 时 间 。 在 行 
波 进位 加 法 器 的 情形 下 ， 产 生 积 的 高 mn 位 <p ，bp yy，…，p > 又 需要 @n) 的 运行 时 
闻 。 在 先行 进位 加 法 器 的 情形 下 ， 仅 需要 @(1g 问 的 运行 时 间 ， 但 全 部 时 间 仍 然 是 @ 人 0。 

在 阵列 匀 法 器 中 有 呈 个 “与 * 门 和 nn 个 全 加 器 。 产 生 高 位 输出 的 吉 法 只 需 再 增加 
G@m) 个 门 。 因 此 ， 阵 列 丧 法 的 规模 为 @(n)。 


拉 .0 【1 
和 了 了 1 了 | 站 和) | 风 
R 和 ZI 1 12 13 ]4 1 
1 3 13 


Carry-Save adder 






1 ]3 
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1 各 
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图 29.15 和 把 mn=8 个 部 分 种 下 由 ， 和 和， 相册 ，…，m 们 相 加 的 华 系 士 树 
29.3.2 ” 华 莱 士 树 乘 法 器 


华 药 士 树 是 能 把 mn 个 ma 位 数 的 求 和 问题 转化 为 两 个 @(n) 位 数 求 和 问题 的 一 种 电路 。 该 
电路 运用 了 1 ny 34 并 行 的 保留 进位 加 法 器 把 n 个 数 的 和 转化 为 fn 7 3 1 个 数 的 和 , 然后 利 
用 得 出 的 [2nay7 3 1 个 数 递归 地 构造 一 树 华 革 士 树 。 通 过 这 种 办 法 ， 数 的 集合 逐步 缩小 直至 
最 后 只 剩 下 两 个 数 。 通 过 并 行 在 执行 保留 进位 加 法 ， 华 菜 士 树 使 我 们 能 够 应 用 一 个 规模 为 
昌 n) 的 电路 在 人 (lg ao 的 运行 时 间 内 对 两 个 nm 位 数 相 乘 ，. 

图 29.1$ 说 明了 一 标 对 8 个 部 分 积 mm，m0，…，mt 相 加 的 华 莱 土 树 。 部 分 积 mg 由 
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n+i 位 组 成 ， 每 条 线 代表 整个 一 个 数 ， 而 不 是 单个 位 ;每 条 线 汶 边 注 明 的 是 它 所 表示 的 数 的 位 
数 ( 兄 练 习 29.3-3), 最 下 面 的 先行 进位 加 法 髓 艳 一 个 2n 一 1 位 数 和 一 个 2n 位 数 相 加 从 而 得 出 
2n 位 的 积 。 


分 析 


华 莱 士 树 要 求 的 运行 时 间 取 决 于 保留 进位 加 法 器 的 深度 。 在 树 的 每 一 个 层次 中 ， 每 组 三 
个 数 被 转化 为 每 组 两 个 数 ， 并 且 组 合 后 至 多 剩 下 琐 个 数 (如 余 最 上 一 明 中 的 由 人 轨 和 men。 因 
此 , 上 输 人 的 华 革 士 树 中 保留 进位 加 法 器 的 最 大 深度 由 下 列 递 归 式 给 出 : 
0 如 果 nm 扩 2 
Dnm = | | 如 果 m 一 3 
DC f2n73ThD 十 如 果 Pm 兰 4 
根据 主 定 理 (和 定理 4.10) 的 第 二 种 情形 可 得 DO) 的 解 为 : D(m=G@flg mm。 每 个 保留 进位 大 
法 贺 所 需 运 行 时 间 为 @@(D)。 所 有 nm 个 部 分 积 可 以 在 B(D) 的 运行 时 间 内 并 行 地 产生 (对 i= 1， 
2，…、nm-ti，m 的 低 王 ! 位 由 硬 连 接 置 为 W)。 先 行进 位 加 法 器 耗费 的 运行 时 间 为 DO(] 
m。 因 此 ， 两 个 n 位 数 的 磁 法 运算 的 全 部 运行 时 间 为 台 ( Ig 吕 。 
两 个 n 位 数 的 华 菜 士 大 形 乘法 着 的 规模 为 @B(n23， 对 此 我 们 说 明 如 下 。 首 先 我 们 找 出 保 
留 进位 加 法 器 的 电路 规模 的 限制 范围 。 因 为 深度 为 1 的 保留 进位 加 法 器 有 1 2ny7y31 个 ， 并 
且 每 个 保留 进位 加 法 虽 中 至 少 包 含 n 个 全 加 器 ， 所 以 容易 得 到 电路 规模 的 下 界 为 Dan2)， 
为 了 得 到 电路 规模 的 上 界 Ota3》， 我 们 注意 到 ， 由 于 最 后 的 积 有 2n 位 ， 因 此 华 莱 土 树 
中 的 每 个 保留 进位 加 法 器 至 多 包含 2n 个 全 加 器 。 我 们 需要 说 明 的 是 总 共有 Oo 个 保留 进位 
加 法 风 。 设 C(m 是 具有 pn 个 输入 数 的 华 芝士 树 所 包含 的 保留 进位 加 法 器 总 数 。 我 们 有 如 下 
递归 式 : ) 如 时 3 
n 二 
Cs<tc [2n73 +Ln3j 如 果 n 郊 4 
由 主 定 理 中 的 第 三 种 情形 可 推 得 COm) 的 解 为 ，C(n)= @(mj。 这 样 我 们 就 得 到 了 华 莱 十 
树 乘法 器 中 保留 进位 加 法 器 的 规模 的 涤 近 意义 上 的 上 界 虽 n3j。 建 立 # 个 部 分 积 的 电路 规模 
为 Btn )， 并 且 最 后 的 先行 进位 加 法 器 的 规模 为 @(n)。 因 此 ， 整 个 滋 法 器 的 规模 为 日 0 。 
从 渐 近 意义 上 来 看 , 基于 华 莱 土 树 的 匀 法 器 虽然 比 阵 列 乘法 器 运行 速度 快 且 两 者 规模 相 
了 同 ， 但 其 实现 布局 既 不 如 阵列 乘法 器 那样 规则 , 也 不 如 后 者 那样 “稠密 "( 指 电路 元 件 间 浪 费 的 
空间 较 小 )。 在 实际 中 经 常 使 用 的 是 两 种 设计 的 一 -种 折衷 方案 。 其 设计 思想 是 并 行 地 使 用 两 
个 啤 列 ,一 个 对 一 半 部 分 积 求 和 , 另 一 个 对 另 一 半 部 分 积 求 和 。 其 传输 时 延 仅 为 用 单 阵列 对 所 
有 am 个 部 分 积 求 和 所 产生 的 传输 时 延 的 一 半 。 再 运用 两 次 保留 进位 加 法 就 可 以 把 4 个 数 的 
咱 列 输出 转化 为 两 个 数 ,然后 再 运用 一 个 保留 进位 加 法 对 这 两 个 数 相 加 就 得 到 结果 的 积 ， 用 
皮 种 方法 其 整个 忧 输 时 延 蚌 全 阵列 加 法 器 的 一 半 多 一 点 ,再 加 上 一 个 附加 的 项 OUg 


29.4 时钟 电路 


组 合 电路 中 的 元 件 在 一 个 计算 过 程 中 仅 使 用 一 次 。 通 过 在 电路 中 引进 时 钟 记忆 元 件 ， 我 
们 就 可 以 重复 使 用 组 合 元 件 。 因 为 时 钟 电路 可 以 多 次 使 用 问 一 个 硬件 ， 所 以 通 党 它 的 规模 比 
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与 其 功能 相同 的 组 合 电路 要 小 得 多 。 

本 节 主 要 讨论 执行 加 法 和 乘法 运算 的 组 合 电路 。 我 们 首先 说 明 一 种 规模 为 O(1) 的 时 钟 
电路 , 称 为 位 串 行 加 法 器 ， 它 可 以 在 @(n) 的 时 间 内 对 两 个 n 位 数 相 加 。 然 后 , 我 们 要 讨论 线 
性 阵列 乘法 器 ， 主 要 介绍 一 种 规模 为 B(m) 的 线性 阵列 乘法 器 ， 它 能 在 B(m) 的 运行 时 间 内 对 
两 个 mn 位 数 相 乘 . 


29.4.1 位 串 行 加 法 


为 了 引信 时 钟 电路 的 概念 ， 我 们 先 回 到 对 两 个 n 位 数 进行 相 加 的 问题 。 团 29.16 说 明 恕 
何 运用 单个 全 加 器 来 获得 两 个 上 位 数 a= <an-:，ar2，…，a0> 和 b= <bo ii， bo， …， 
bu> 的 n+l 位 的 s= <s， sl，…，B>。 外 部 世界 每 次 只 提供 -- 对 输入 位 : 开始 是 ae 和 
bu， 煞 后 中 ai 和 bi， 如 此 于 去 站 至 结 训 。 虽 然 我 们 希望 某 一 位 产后 的 出 进位 成 为 让 一 你 的 
和 进位， 但 是 我 们 却 不 能 把 全 加 器 的 输出 < 直接 馈送 作为 下 一 次 的 输入。 这 里 有 一 个 时 间 问 
题 ; 进 入 全 加 器 的 人 进位 5 必须 对 应 于 适当 的 输入 ai 和 bj。 如 果 这 些 输入 位 不 能 演 及 馈 进 位 
亲 时 到 达 ， 则 输出 就 有 可 能 发 生 错 误 。. 

如 图 29.16 所 示 ， 解 决 的 办 法 是 采用 一 个 时 钟 电路 ， 或 时 序 电 路 ， 它 由 组 会 电路 部 分 以 
及 一 个 或 多 个 寄存 器 (时 钟 记忆 元 件 ) 组 成 。 其 中 的 组 合 电 路 的 输 人 可 以 来 自 于 外 部 批 界 ， 也 
可 以 来 自 于 寄存 器 的 输出 。 它 产生 的 输出 可 以 提供 给 外 部 世界 ， 也 可 以 作为 寄存 器 的 输 人 ， 
与 前 面 组 合 电路 中 一 样 ， 我 们 规定 时 钟 电路 中 的 组 人 台电 路 不 能 包含 同 路 。 
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图 29.16 位 串 行 加 法 器 的 操作 过 程 


时 钟 电 路 中 的 每 个 寄存 器 由 一 个 周期 性 的 展 号 ， 或 时 钟 来 控制 。 每 当 脉冲 到 来 时 ， 麻 存 
器 加 载 并 存储 输入 的 值 。 在 两 个 连续 的 时 钟 脉冲 之 间 的 时 间 称 为 一 个 时 钟 周 期 ， 砷 一 个 完 伞 
的 时 钟 电路 中 ， 每 一 个 寄存 器 均 按 照 同一 个 时 钟 进 行 工作 . 

现在 让 我 们 更 细致 地 来 看 看 寄存 器 的 操作 过 程 。 我 们 把 每 个 时 钟 信号 看 作为 一 个 瞬间 的 
脉冲 。 在 时 钟 脉冲 到 来 时 ， 寄 存 器 读 人 此 刻 的 输入 值 并 存储 该 值 。 这 一 被 存储 的 值 接 痢 总 出 
现 于 寄存 器 的 输出 端 ， 它 可 以 用 于 计算 下 一 个 时 钟 脉冲 到 来 时 进入 其 他 寄存 器 的 值 。 换 句 话 
说 ， 在 一 个 时 钟 周期 里 出 现在 寄存 器 输入 端的 值 在 下 一 个 时 钟 周期 里 将 出 现在 寄存 器 的 输出 
端 。 

现在 我 们 来 仔细 研究 一 下 图 29.16 中 的 电路 ， 我 们 称 之 为 位 串 行 加 法 器 。 为 了 使 全 加 器 
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的 输出 保持 主 确 ， 我 们 要 求 时 钟 周期 至 少 不 短 于 全 加 器 的 传输 时 延 ， 这 样 可 以 使 组 合 电路 在 
两 次 时 钟 间 遇 中 有 一 个 稳定 的 状态 。 在 时 钟 周期 0， 如 图 29.16(a) 所 示 ， 外 部 世界 把 两 个 输 
人 位 ae 和 bo 提供 给 全 加 器 的 两 个 输 人 端 。 我 们 假定 寄存 器 的 存储 单元 初始 化 为 0, 因此 初始 
时 的 人 进位 ， 即 寄存 器 的 输出 为 0。 在 该 时 钟 周 期 末了 ， 全 加 器 产生 和 位 % 和 出 进位 c 。 产 
生 的 和 位 % 向 外 部 世界 输出 ， 这 里 我 们 假定 它 将 作为 最 后 的 和 s 的 -个 部 分 存储 起 来 ， 全 
加 器 出 进位 镇 送 给 寄存 器 ， 以 便 在 下 一 个 时 钟 到 来 时 把 cl 读 人 寄存 器 。 因 此 在 时 钟 周期 
的 开始 ， 冤 存 器 包含 c 的 值 。 如 图 29.17(b) 所 示 ， 在 时 钟 周 期 1 期 间 ， 外 部 世界 把 a 和 了 
提供 给 全 加 器 ， 全 加 器 再 从 寄存 器 读 和 人 c， 并 产生 输出 s 和 cu。 和 位 5 向 外 部 世界 输出 ，c。 
则 反馈 给 寄存 器 。 这 一 循环 将 继续 进行 直至 时 钟 周 期 n， 这 时 寄存 顺 包 含 c， 如 图 29.16(@) 
所 示 ， 然 后 外 部 世界 置 am= bn=0， 因 此 我 们 得 到 s =e 。 


分 析 


为 了 确定 完全 时 钟 电路 所 占用 的 全 部 时 间 t， 我 们 必须 知道 时 钟 周 期 数 p 和 每 个 时 钟 周 
期 的 持续 时 间 d， 有 t= pd。 时 钟 周期 d 必须 是 够 长 以 使 组 合 电路 在 两 次 时 钟 之 间 有 一 个 稳 、 
定 的 状态 。 虽 然 对 某 些 输 人 电路 可 能 较 早 就 进入 稳定 状态 ， 但 如 果 要 求 对 所 有 输入 电路 都 能 
正确 工作 ， 则 d 必须 至 少 与 组 合 电路 的 深度 成 正比 ， 

让 我 们 看 看 两 个 n 位 数 进行 串 行 加 法 需要 多 少时 间 。 因 为 全 加 器 的 深度 为 @(D)， 所 以 
每 个 时 钟 周期 的 时 间 为 @(1D)。 又 因为 要 产生 所 有 输出 要 求 有 n+ 个 时 钟 脉冲 ， 所 以 搞 行 位 
串 行 加 法 的 全 部 时 间 为 (n+DG@()= en)。 

位 串 行 加 法 的 规模 (组 合 元 件数 加 上 寄存 器 数 ) 为 (1 


行 波 进 位 加 法 与 位 串 行 加 法 


我 们 注意 到 ， 行 波 进位 加 法 器 就 好 像 是 一 个 复制 的 位 串 行 加 法 器 ， 只 不 过 把 后 者 中 的 寄 
存 器 代 之 以 组 合 元 件 问 的 直接 相连 。 这 就 是 说 ， 行 波 进位 加 法 器 相应 于 位 冲 行 加 法 器 的 计算 
过 程 在 空间 中 的 "展开 "。 行 波 进位 加 法 器 中 的 第 i 个 全 加 器 实现 位 串 行 加 法 器 第 i 个 时 钟 周 
期 里 的 操作 。 

一 般 地 说 ， 如 果 预 先知 道 时 钟 电 路 运行 的 时 钟 周期 数 ， 就 可 以 找 出 在 浙 近 意义 上 与 其 有 
着 相同 时 延 的 等 价 的 组 合 电路 来 代 着 它 。 当 然 ， 我 们 要 进行 权衡 时 钟 电路 使 用 的 电路 元 件 
较 少 ， 但 组 合 电路 的 长 处 在 寺 控 制 电路 少 ， 不 需要 时 钟 或 同步 的 外 部 电路 来 提供 输入 位 并 碟 
储 和 位 。 此外， 尽管 从 渐 近 意义 上 来 看 两 种 电路 有 相同 的 时 延 ， 但 是 在 实际 中 组 合 电路 的 运 
行 速度 要 稍 快 一 些 。 其 原因 在 于 在 每 个 时 钟 周期 内 ， 组 合 电路 无 需 等 待 值 进入 稳定 状态 ， 如 
果 所 有 的 输入 都 能 立刻 进入 稳定 状态 ， 则 相应 的 值 就 可 以 以 最 大 速度 通过 电路 而 无 需 等 待 时 
钟 的 到 来 。 


29.4.2 ”线性 阵列 并 法 器 


为 了 对 两 个 na 位 数 相 乘 ， 第 29.3 节 中 讨论 的 组 合 滋 法 器 的 规模 为 @n2)。 我 们 现在 讨论 
两 种 电路 元 件 成 线性 阵列 ， 而 不 是 二 维 阵 列 的 乘法 器 。 与 阵列 乘法 器 相似 ， 这 两 种 线性 阵列 
乘法 器 中 较 快 的 一 种 的 运行 时 间 为 Btn)。 

线性 阵列 乘法 器 实现 了 俄罗斯 农民 算法 (因为 在 19 世纪 访问 俄罗斯 的 西方 人 发 现 该 算法 
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所 在 那里 广泛 使 用 ), 如 图 29.17 所 示 : (aj 采用 十 进 制 数 。(b) 采用 二 进 制 数 。 给 定 两 个 答 
人 数 a 和 b， 我 们 得 到 两 列 数 ， 每 列 数 以 a 和 bb 开头 。 在 每 一 行 中 ，a 列 的 每 项 是 前 面 一行 
中 的 项 的 一 半 ， 小 数 部 分 省 略 。b 列 中 的 每 项 荐 前 面 一 行 中 的 项 的 两 倍 ， 最 后 一 行 中 、a 齐 
的 项 为 1、 我 们 检查 一 下 所 有 a 列 中 包含 奇数 值 的 项 并 对 其 相应 的 b 列 中 的 项 求 和 ， 其 结果 
就 是 积 a.b。 ; 


a 要 


19 29 10011 11101 
9 58 1001 FITOLO 
4 3116 100 1110100 
2 232 10 11401000 
1 464 tL ltio10000 

551 1000100111 


醒 四 tb) 


-图 29.17 “采用 覆 罗 斯 农民 算法 来 计算 19 和 29 的 乘积 


尽管 俄罗斯 农民 算法 似 平 很 奇怪 ， 但 图 29.17(b) 说 明 它 确实 是 小 学 乘法 方法 的 一 种 一 进 
制 实现 方法 ， 运 行 时 间 为 名 ( 叫 ，。 但 疼 中 的 数 用 十 进 制 表述 而 设 有 用 二 进 制 表述 ，a 列 中 项 
为 奇数 的 行 所 对 应 的 b 与 2 的 适当 次 堵 相 乘 的 结果 组 成 了 最 后 的 积 。 


一 种 慢 速 线性 阵列 实现 方法 


图 29.18(a) 示 出 了 实现 两 个 nm 位 数 的 俄罗斯 农民 算法 的 方法 , 时 间 为 BCn )。 我 们 使 用 
一 个 由 2n 个 单元 的 线性 阵列 构成 的 时 钟 电路 。 每 个 单元 包含 三 个 寄存 器 。 一 个 寄存 器 包 
含 a 的 一 位 ， 一 个 寄存 器 包含 b 的 一 位 ， 另 一 个 包含 积 p 中 的 一 位 。 我 们 使 用 上 和 角 标 来 表 
示 算 法 的 每 步 操作 前 单元 的 值 。 例 如 ， 在 第 j 步 前 位 a, 的 值 表示 成 au ， 并 且 我 们 定义 a 


_ 刁 辐 
一 式 am-t aa 2， ，ao ~。 


算法 按 m 步 组 成 的 序列 依次 执行 (各 步 依次 标号 为 0，1，…，nm 一 1D)， 每 一 步 占用 一 个 
时 钟 周期 。 算 法 保证 在 第 计 步 前 有 如 下 条 件 成 立 : 
ab +p” 一 ab (29.6) 
( 见 练习 29.4 一 2)。 初 始 时 ，a" = a，b”" = b，p”=0。 第 j 步 由 下 列 计算 过 程 组 成 ; 
1. 如 果 au 为 寄 数 ( 即 ag = 1D)， 则 把 b 和 P 相 加 : p' ”二 bs +Pp"”。( 这 一 加 法 运算 
由 行 波 进位 加 法 器 对 整个 阵列 执行 ， 进 位 从 右 至 左 通过 阵列 。) 如 果 a'” 为 偶数 ， 则 直接 
使 p 进入 下 --- 步 : po po 


2. 拒 a 去 称 一 位 
2 如 果 0 <i<2n 一 2 
嫉 如果 i=2n 一 1 
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3. 把 b 左 移 一 位 : 

brn ， 人 如 果 1<i<2n-1 
0 .如 果 i=m0 

在 运行 了 n 步 后 ， 我 们 已 把 的 挤 有 位 都 移出 ， 因此 ，ao =0。 Cg 的 条 件 说 明 
人 一 ab。 


enumntxsr OrTnSeT 
aaaaamaamr 4 


和 -09 [9 于 so- 19 
拘 pi 
2 0= 加 
0 

人 28 
neg bb- 

48 = 吕 

由 = 23 4 =239 

2 - ， 

隐 一 11 

5 一 | 看 9 3 

加 := 4 

中略 


本 := 4 


人 at Ai- 
2 
co 四 旧 旧 加 四 oa 
2 四 四 四 5 
避 国 加 四 已 vi 48 
到 so 台 | 回 
8 - . 站 日 岂 中 = 464 
pn- 7 ooliollollue 和 
jiojloeRejtUb = 4 
3 人 0 中 加- 
gg BO 928 5 
到 La 2 一 
中， | 1 8 后 加 0 


图 29.18 居家 鸯 并 法 的 机 和 肯 往 开 交 于 





现在 我 们 对 算法 进行 分 析 。 如 果 假 设 控 制 信息 被 同时 广播 到 每 个 单元 ， 则 总 共有 
步 ， 在 最 坏 情 况 下 每 步 的 运行 时 间 为 @(n)， 这 是 因为 行 波 进位 加 法 器 的 深度 为 @tn)， 因 此 
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时 钟 周 期 至 少 要 持续 @@( 由 时 间 。 每 个 移 位 操作 仅 需 名 (it 的 时 间 。 因 此 算法 的 总 的 运行 时 间 
为 日 (p)。 国 为 每 个 单元 的 规模 为 常数 ， 所 以 整个 线性 阵列 的 规模 为 @@(n)， 


一 种 快速 的 线性 阵列 实现 方法 


如 果 用 保留 进位 加 法 代替 行 波 进位 加 法 ， 我 们 就 能 把 每 一 步 的 运行 时 间 减 少 到 @(BD， 
因而 可 以 使 整个 运行 时 间 改 进 为 @(m。 如 图 29.18(b) 所 未 ， 每 个 单元 间 辣 时 包含 a 项 的 一- 
位 和 hb 项 的 一 位 。 另 外 还 包含 u 和 Yv 的 各 一 位 ， 它 们 是 保留 时 位 加 法 的 输出 。 在 使 用 保留 
进位 加 法 以 累加 形成 相应 积 后 ， 我 们 保持 下 列 条 件 成 立 , 即 在 第 j 步 以 前 : 
a9 .b+ug+Hv 名 一 ab (29.7) 

(参见 练习 29.4-2) 每 一 步 对 a 和 移 位 的 方式 与 前 面 慢 速 实现 方 法 相同 ， 把 等 式 (29.6 和 
(29. 刀 综合 后 得 到 ud+wb= pg。 因此 ， um 的 各 位 和 的 各 位 与 慢 速 实现 方法 中 p 的 各 位 包含 
相同 的 信息 。 

在 快速 实现 方法 的 第 i 步 ， 是 对 和 v 执行 保留 进位 加 法 ， 其 中 操作 数 取决 于 a 是 奇数 
还 是 偶数 。 如 果 ay = 1， 我 们 计算 


”一 parity(b? ， ua ， V) 1 一 0，1，…，2n 一 ] 
6+ feieapr' ui ，， |) 如 果 1 过 iji 系 2n 一 1 
W. 十 一 

加 0 如 果 i=0 

否则 ,a。= 0， 则 计算 ， 

ns 二 parity0，u ww) ii=0 1 …， 2n 一 1 
6+ fmaiong uv ) 如 果 1<is2n-1 
WW 看 一 
0 如 果 i = 


在 对 u 和 v 进行 更 新 后 ， 第 i 步 后 把 a 右 移 ， 并 把 b 左 移 ， 移 位 方法 和 慢 速 实现 方法 中 
相间 

快速 实现 方法 总 共 要 执行 2n~1 步 。 对 jzn， 我 们 有 a9 = 0， 因此 (29.7) 中 的 条 件 说 明 
no 一 ab。-- 且 a@=0， 所 有 以 下 各 步 仅 是 对 也 和 、Y 执行 保留 进位 加 法 ， 练 习 29.4-3 
要 求证 明 : verD=0，uenrD=a .b。 

由 于 2n-1 步 中 的 每 一 步 的 时 间 为 @(1D)， 所 以 在 最 坏 情 况 下 ， 全 部 运行 时 间 为 9(n)。 
因为 每 个 单元 的 规模 依然 为 常数 ， 所 以 整个 规模 仍然 是 B(n)， 


思 考 题 


29-1 除法 电路 


我 们 可 以 利用 一 禹 称 为 牛顿 类 和 伐 的 技术 ， 用 减法 和 乘法 电路 来 构造 除法 电路 。 我 们 将 着 
重 亲 述 有 关 计 算 倒 数 的 问题 ， 因 为 我 们 只 要 在 此 基础 上 再 做 一 次 乘法 运算 就 能 获得 一 个 除法 
电路 。 

设计 惠 想 是 : 通过 使 用 下 列 公式 计算 一 个 序列 m， 轴 ，yY，… 以 逐步 通 近 数 x 的 倒数 : 
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yi 一 2 一 xyi 
假设 x 是 给 定 的 n 位 二 进 制 小 数 ， 目 172<xs1. 由 于 倒数 可 能 是 一 个 无 限 循环 小 
数 ， 所 以 我 们 将 注意 力 放 在 计算 出 一 个 位 并 且 精 确 到 其 最 小 有 效 位 的 近似 值 ， 
a. 假定 对 某 个 常数 e> 0， 有 |y, - /xs e, 证明 : |y ， 一 17 对 乏 e 。 


b. 给 定 一 个 初始 近似 值 y ， 以 使 得 y， 满足; 对 所 有 上 0，ly，，/ 对 入 2 ”。 为 使 近 
似 值 y 精确 到 其 最 小 有 效 位 ，k 的 值 必 须 为 多 大 ? 

c. 提 述 一 个 组 合 电路 ， 使 其 对 一 个 给 定 的 位 输入 能 在 O0g:n) 的 志 行 时 间 内 计算 
出 17x 的 nm 位 近似 值 。 所 给 出 的 电路 的 规模 是 多 大 ? 


29-2 关于 对 称 函 数 的 布尔 公式 
如 果 一 个 口 输 和 人 函数 fx ，x,，…，x ) 满足 , 对 :{I，2，…} 上 的 任意 排列 zx 都 有 


fx 、X,，…， X 一 作 X oh， 和 X 
我 们 就 说 该 晒 数 是 对 称 函 数 . 在 这 一 问题 中 ， 我 们 将 要 说 明 存 在 一 个 表示 了 的 布尔 公式 ， 
其 规模 为 a 的 多 项 式 。( 在 此 ， 布 尔 公式 是 指 由 变量 x ，x ，…，x ， 括 号 和 布尔 运算 


2 


符 信 ，Yv 和 一 组 成 的 一 个 串 。) 我 们 的 方法 是 将 一 个 对 数 深度 的 布尔 电路 转化 为 等 价 的 多 
项 式 规 和 嵌 的 布尔 公式 。 我 们 假定 所 有 电路 均 是 由 两 输入 “与 ” 门 ， 两 输 人 或 - 站 和 “ 
非 ” 门 构成 的 。 

a. 我 们 先 考察 一 个 简单 的 对 称 函 数 。 具有 是个 布尔 型 输入 值 的 推广 的 多 数 函 数 由 下 式 
定 多 : 


， ， -{ 如 果 x | 十 X。 十 人 … 十 X >n/2 
majority  (x， ，X， …， 友 上 一 无 则 
试 描述 一 个 计算 majority， 的 深度 为 Disgn) 的 组 合 电路 .( 提示 : 建造 一 棵 加 法 器 树 ) 
b. 假定 了 是 关于 nm 个 布尔 变量 x,，x,，…，x， 的 一 个 任意 布尔 函数 , 再 假定 存在 一 个 


深度 为 d 的 电路 C 以 计算 f 说 明 如 何 从 CC 构造 一 个 关于 f 的 布尔 公式 ， 其 长 度 为 DO(2 )， 
证 骨 存在 一 个 关于 Imajority 的 多 项 规模 的 公式 。 
c. 论证 任何 对 称 的 布尔 孙 数 fx ，x, ，…，x ) 都 可 以 表述 为 枯 数 : > xi 


d. 论 证 任何 有 n 个 布尔 型 输入 的 对 称 函 数 都 可 以 由 一 个 深度 为 O(lg mm) 的 组 合 电路 进行 
计算 . 

e, 论 证 任何 具有 nm 个 布尔 型 变量 的 对 称 布尔 函数 都 可 以 用 一 个 长 度 为 n 的 多 项 式 的 布尔 
公式 表述 . 


练习 二 十 九 


29.1-1 在 图 29.2 中 ， 把 输入 y 的 值 变 为 1。 说 明 每 条 线路 上 的 结果 值 。 
29.1-2 试 说 明 如 何 用 n 一 1 个 “* 异 或 " 门 构造 一 个 具有 工 个 输入 且 次 度 为 lga ] 的 奇偶 校 验 电 路 . 
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29.1-3 证 明 : 用 常数 个 "与 "或 ",* 非 " 门 可 以 构造 出 任何 布尔 组 合 元 件 ，( 提 示 :， 按 该 元 件 的 均值 表 
到 实现 ) 

29.1-4 证 只 完全 形 " 与 非 ? 们 喜 可 以 构造 出 任意 的 布尔 画 数 。 

29.1-5 试用 4 个 2 输入“ 与 非 ?站 构造 一 个 执行 “ 异 或 "函数 的 组 合 电路 。 

29.1-6 设 CC 是 这 庶 为 dd 具有 nm 个 输 信 和 mn 个 输出 的 组 侣 电路。 如 时 把 两 个 相同 的 电路 尼 进行 连 
接 ， 使 其 中 一 个 的 输出 雇 接 馈送 给 另 一 个 作 输 人 ， 这 一 串联 电路 的 最 大 可 能 深度 是 多 少 ?最 小 可 能 深 谋 交 是 
条 少 ” 


"9.2-1 设 a=<0ll1II111>，b= <00000001> ，Ba=8。 当 对 这 两 个 序列 执行 行 波 进位 加 法 时 ， 斌 指 
出 其 和 以 基 全 加 堪 的 进位 输出 。 罕 吕 对 应 于 a 和 的 进位 状态 和 ， 抽 ，…， 冲 ， 在 图 29.9 中 的 并 行 前 轻 电 
路 的 每 条 线路 二 锋 出 这 些 的 给 人 的 值 ， 并 说 明 产 生 的 输出 mW，yYi，…， 磺 。 

29.2- > 证 明 : 图 29.5 给 出 的 进位 状态 运算 符 满足 结合 律 。 

区 .2-3 举例 说 明 在 mn 值 不 是 2 的 其 的 情形 证， 如 和 何 构造 运行 时 间 为 OILEI) 的 并 行 前 轰 电 路， 并 画 出 
n 一 11 时 的 并 行 芍 经 电路 。 撒 述 形 如 任意 二 叉 树 的 并 行 前 氏 电 路 的 性 能 。 

29.2-4 说 明 杠 &GPF 的 门 级 构造 。 俱 定 若 上 =k， 则 用 <00> 表 本 每 个 输出 x%， 若 和 =g， 则 用 
<11> 表示 每 个 输出 和。 车 xi=p， 则 用 <01> 或 <10> 表示 每 个 输出 x。 同 时 假定 若 y=k， 则 几 0 玲 示 
每 个 输入 Y， 若 六 =g， 风 用 【表示 每 个 输 人 Yi。 

29.2-S$ 在 图 29.9a) 的 并 行 前 缀 电 政 标 出 叙 条 线路 的 深 诬 ， 昌 路 中 的 关键 路 径 是 指 从 输 和 人 到 输出 的 所 
有 路 径 中 起 合 元 件数 日 蕊 多 的 一 条 路 径 。 指 出 图 29.Wa) 中 的 关键 路 径 ， 并 证 明 其 长 度 为 Qim， 证 明 某 
个 结 癌 目 有 操作 时 划 柏 差 克也 问 的 名 元 件 。 是 天 存在 其 多 元 件 同时 操作 的 结 点 ? 

29.2-6 对 为 2 的 寡 的 任意 输入 数 n， 画 出 图 29.19 中 电路 的 递归 性 框图 ， 在 框图 的 基础 上 论证 电路 确 
实在 执行 前 回 计 算 过 程 。 证 明 电 路 的 琛 度 为 (]E 目 ， 规 模 为 人 mn 地 m， 





图 2329.19 练习 29.2 一 6 中 的 并 体 剖 缕 电 及 


29.2 7 在 先行 进位 加 法 器 中 任意 线路 的 最 大 而 出 是 多 少 ? 证 明 : 邵 司 我 们 限制 门 的 盘 出 为 DID)， 依 然 
可 上 让 一 个 规模 为 @tai 的 电路 在 如 (二 站 的 运行 时 间 内 完成 加 法 运行 。 


29.2-8 计数 电路 有 个 二 进 制 输 人 和 如 = Tlg fnH) 1 个 输出 。 如 果 把 输出 看 作 二 进 制 数 ， 则 它 在 值 
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为 输 人 中 1 的 个 数 。 例 如 ， 如 果 输 和 是 <10011110> ， 输 出 是 <101> ， 则 说 明 输 大 中 有 5 个 1。 试 揪 述 一 
个 规模 为 @@(m， 深 度 为 Qt 属 二 的 计数 电路 ， 
29.2-9* 证 明 : 如 果 人 允许 “与 " 门 和 "或 " 门 可 以 有 任意 高 的 请 人 ， 则 可 以 用 诬 度 为 4 且 规 模 为 nm 的 堵 
钙 趟 的 组 合 电路 来 完成 n 位 加 法 运算 。 
29.2-10* 假设 用 行 证 进位 加 法 器 随机 的 两 个 m 位 数 进行 相 加 。 其 中 两 个 数 的 每 一 位 是 0 或 工 的 概率 
相 问 。 证明: 进位 重 前 连续 传播 小 于 QIEa 缀 的 概率 至 少 为 1-17n。 换 名 话说， 尽管 行 波 进 位 加 法 朵 的 
深度 为 怠 (n)，、 伍 对 两 个 随机 级 ， 和 输出 几乎 总 是 在 G 培 癌 运行 时 间 内 产后， 


29.3-1 证 明 :; 在 阵列 飞 法 器 中 v = 0， 其 中 记 2， 人 …，n-1，j=0，1，…，i in，ira+l， 
230 一 | 。 

329.3-2 证 明 : 在 图 29.13 的 阵列 冬 法 内 中 ， 在 最 上 面 一 行 中 除 一 个 全 加 器 外 ， 其 他 的 所 有 全 加 器 都 是 
不 必要 的 。 竖 求 重 新 布线 设计 电 踏 。 

29.3-3 假定 保留 进位 加 法 器 把 x， 了 和 z 作为 输入 并 产生 输出 s 和 c， 以 上 五 个 值 分 别 有 ny 位 、my 
位 、m 位 、m, 位 和 me 位 。 不 朱 一 般 性 ， 我 们 也 假定 nx 芝 Dn, 乏 nx。 证 明 ns=mn:， 并 且 : 

8 采 n， <， 
由 | +1 如 果 " 一 t 

29.3-4 证 明 : 刀 使 我 们 对 门 的 万 出 限制 为 OK1)， 仍 然 可 以 运用 规模 为 OG 的 电路 在 DO(lg 加 的 运行 时 
也 内 执行 乘法 运算 ， 

29.3-S5 描述 一 全 有 效 电路 以 计算 出 一 个 二 进 制 数 害 3 确 所 得 的 商 。( 提 示 : 广 意 在 二 进 制 运算 中 有 : 
.0D10101…，=-0Lx101x1.000I1x-…，)。 

29.3-6 循环 移 位 器 (或 称 桶 形 称 位 器 ) 是 一 种 具有 两 个 输 人 X= <x -Ra 0 和 5 一 和 Sn 
ss 的 电路 ， 其 中 四 == [Ta ]。 它 的 输出 为 了 = 天 Yo， 加 区 >， 其 中 入 症 moa 呈 
ij=0，1，2，…，m=1， 亦 即 ， 穆 位 器 根据 s 所 指出 的 量 对 x 的 各 位 进行 旋转 变换 。 试 描述 一 个 有 效 的 循环 
移 位 器 。 根 据 模 居 化 乘法 的 概念 ， 箱 环 移 位 器 执行 的 古 何 种 功能 ? 


?9.4-1 设 a=<101101>，b=<0l11110> ，n=5， 在 输入 为 a 和 hb 的 情况 下 ， 试 用 十 进 制 和 .二 进 制 
曲 种 方式 说 明俊 网 斯 农 氏 算法 的 执行 过 程 。 

29.4-? 证明: 对 线性 阵列 乘法 髓 ， 不 变 式 (29. 丘 和 (29. 7 成 立 。 

329.4-3 ”证明 : 在 快速 线性 阵列 乘法 中 有 ve =0。 

29.4-4 试 述 为 什么 第 29.3.1 节 中 的 阵列 来 法 器 大 快速 线性 阵列 乘法 器 计算 过 程 的 一 种 “展开 ? 

29.4-5 考察 一 个 数据 流 <x，x，…，>， 该 数据 流 以 每 个 时 钟 脉冲 一 个 值 的 速率 到 达 某 个 时 钟 电 
路 ， 对 某国 定 值 nm， 该 电路 必须 计算 出 值 : 


y， 一 TAX ft 一 阐 十 1 


T 一 二 | 又 | 空 上 


就 中 说， 中 电路 最 近 接收 到 的 mn 个 值 中 的 最 大 值 . 试 给 出 一 个 规模 为 On) 的 电路 ， 使 其 能 在 每 个 时 钾 脉 
冲 刘 来 时 输入 值 x 并 在 D(1) 的 运行 时 间 内 计算 出 输出 值 7 了。 该 电路 可 以 使 用 寡 存 器 以 及 能 计算 丽 个 输 人 中 
的 最 大 值 的 组 合 元 件 ， 

29.4-6* ” 鹿 做 款 习 29.4-5， 要 求 只 使 用 OUlg 可 个 计算 "最 大 值 "的 元 件 。 
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第 三 十 章 ”关于 并 行 计算 机 的 算法 


随 着 并 行 处 理 硬 件 性 能 的 迅速 提高 ， 人 们 对 并 行 算法 的 兴趣 也 日 益 增 加 ， 所 谓 并 行 算法 
是 指 一 次 可 执行 多 个 操作 的 算法 。 对 并 行 算 法 的 研究 现在 已 发 展 为 一 个 独立 的 研究 领域 。 本 
书 中 用 串 行 算 法 解决 的 很 多 问题 也 已 经 有 了 相应 的 并行 算法 。 在 本 章 中 ， 我 们 将 阐述 一 些 简 
单 的 并 行 算法 以 说 明 一 些 基 本 概念 和 技术 。 

为 了 学 习 并 行 算法 ， 我 们 必须 选择 一 种 适用 于 并 行 讨 算 的 模型 。 在 本 书 中 大 部 分 使 用 的 
随机 存 取 计 算 机 (RAM) 当 然 是 果 行 的 .我 们 已 经 学 过 的 并 行 忆 型 一 一 排序 阿 络 (第 二 十 八 章 ) 
和 旦 路 (第 一 士 九 章 广 一 -有 太 多 的 限制 ， 不 宜 用 它 来 讨论 算法 的 数据 结构 。 

本 章 中 的 并 行 算法 用 一 种 流行 的 理论 模型 即 并 行 随机 存 取 计算 机 (PRAM) 来 描述 。 很 多 
关于 数组 ， 表 、 树 和 图 的 并 行 算法 都 可 以 很 容易 地 用 PRAM 模型 来 描述 。 如 果 一 个 
PRAM 算法 在 性 能 上 超过 另 一 个 PRAM 算法 ， 则 当 两 个 算法 在 一 台 实 际 的 并 行 计 算 机 上 
运行 时 其 相对 性 能 不 会 有 很 大 变化 。 


PRAM 模型 


图 30.1 说 明了 PRAM 的 基本 结构 。 其 中 有 nm 个 普通 的 { 串 行 ) 处 理 器 pe，pPpi，…，P_i 
共 学 一 个 全 局 存储 器 。 所 有 处 理 器 都 可 以 “并 行 地 "( 同 时 ) 从 全 局 存 铺 器 读 出 信息 或 向 全 局 存 
储 器 写 人 信息 。 各 处 理 器 也 可 以 并 行 地 执行 各 种 算术 和 有 逻辑 操作 。 





图 30.1 PRAM 的 基本 构造 


在 PRAM 模型 中 关于 算法 性 能 的 最 关键 的 一 点 是 : 假设 运行 时 间 可 以 用 算法 执行 的 并 
行 的 存 销 器 存 取 次 数 来 衡量 。 这 一 假设 是 对 普通 的 RAM 模型 的 直接 推广 ， 并 且 用 存储 器 
存 取 次 数 来 衡量 运行 时 间 对 PRAM 模型 也 是 很 适合 的 。 这 一 简单 的 假设 对 于 我 们 研究 并 行 
算法 有 很 大 帮助 ， 不 过 真正 的 并 行 计 算 机 并 不 能 做 到 在 单位 时 间 内 对 全 局 存储 器 并 行 地 执行 
存 取 操 作 : 对 存储 器 进行 存 取 操作 所 需 的 时 间 随 着 并 行 计算 机 中 处 理 器 数目 的 增加 而 相应 增 
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加 。 

然而 ， 对 于 以 任意 方式 对 数据 进行 存 取 的 并 行 计 算 机 来 说 ， 可 以 证 明 存 取 操 作为 单位 时 
间 的 假设 是 成 立 的 。 实 际 中 的 并 行 计算 机 都 包含 一 个 通讯 网 络 以 便 支 持 一 个 抽象 的 全 局 存储 
器 。 与 算术 操作 等 其 他 操作 相 比 ， 通 过 网 络 存 取 数据 是 相当 慢 的 。 因 此 ， 计 算出 两 种 并 行 算 
法 所 执行 的 并 行 的 存储 器 存 取 次 数 就 可 以 对 其 相对 性 能 作出 精确 的 估计 。 实 际 的 计算 机 与 
PRAM 的 单位 时 间 抽 象 不 一 致 ， 主 要 在 于 某 种 存储 器 存 取 模 式 可 能 比 其 他 模式 快 。 但 是 ， 
作为 一 种 近似 找 述 ，PRAM 模型 的 单位 时 间 存 取 的 假设 还 是 合乎 情理 的 。 

并 行 算法 的 运行 时 间 既 依赖 于 执行 算法 的 处 理 器 数目 ， 也 依 束 于 输 人 问题 本 身 的 规模 。 
一 般 来 说 ， 在 分 析 PRAM 算法 时 我 们 必须 周 时 讨论 其 时 间 和 处 理 器 孝 目 ， 这 与 串 行 算法 完 
全 不 辐 ， 在 串 行 算法 中 我 们 主要 集中 于 对 时 间 的 分 析 。 当 然 ， 我 们 在 算法 使 用 的 处 理 器 数目 
与 其 运行 时 间 之 问 要 进行 权衡 。30.3 节 中 将 讨论 这 一 权衡 问题 。 


并 发 存储 器 存 取 方 式 与 互 斥 存储 器 存 取 方 式 


并 发 读 算 法 是 指 在 算法 执行 过 程 中 多 处 理 圳 可 以 同时 对 共享 存储 器 的 同一 位 置 进行 读 操 
作 的 一 种 PRAM 算法 。 互 斥 读 算 法 是 指 在 算法 执行 中 侍 和 何 两 个 处 理 器 都 不 能 同时 对 共享 存 
储 器 的 同一 位 辕 进 行 读 操作 的 一 种 PRAM 算法 。 

类 似 地 ， 我 们 根据 多 处 理 器 能 和 否 在 同一 时 刻 对 共享 存储 器 的 同一 位 置 执 行 写 操 作 也 可 以 
把 PRAM 算法 划分 为 并 发 写 算 法 和 五 斥 写 算法 。 我 们 所 遇 到 的 算法 类 型 一 般 采 用 以 下 缩写 
形式 : 

EREW: 互 斥 读 用 下 斥 写 

CREW: 并 发 读 且 互 斥 写 

ERCW: 互 斥 读 月 并 发 写 

CRCW: 并 发 读 蕊 并 发 写 

在 这 些 算 法 类 型 中 ， 节 常见 的 是 EREW 和 CRCW。 仅 支持 EREW 算法 的 PRAM 称 
为 EREW PRAM， 仅 支持 CRCW 算法 的 PRAM 称 为 CRCW PRAM。 一 个 CRCW 
PRAM 当然 能 够 执行 EREW 算法 ， 但 EREWPRAM 不 能 直接 支持 CRCW 算法 所 要 求 的 
并 发 存储 器 仓 取 操 作 。EREW PRAM 的 底层 硬件 相对 来 说 比较 简单 ， 并 且 因为 它 无 需 对 相 
互 冲突 的 存储 器 读 写 操作 进行 处 理 ， 办 此 运行 速度 也 比较 快 。 如 果 单 位 时 间 假 设 能 相当 精确 
地 衡量 算法 的 性 能 ， 则 CRCW PRAM 就 需要 更 多 的 硬件 支持 ， 伍 它 可 以 证 明 它 能 够 提供 
一 种 比 EREW PRAM 更 直接 的 操作 设计 模型 。 

在 剩 下 的 两 种 算法 类 型 一 -CREW 和 ERCW 中 ， 有 关 的 论文 书籍 更 重视 CREW。 但 
是 从 实际 应 用 的 角度 来 看 ， 要 支持 并 发 写 操作 并 不 比 支 持 并 发 读 操 作 更 困难 ， 在 本 章 中 ， 如 
果 算 法 包含 并 发 读 或 并 发 写 操作 ， 我 们 一 般 就 把 它 作 为 CREW 而 不 再 进行 细 分 。 我 们 将 在 
第 了 0.2 和 他 中 更 详细 地 讨论 这 一 区 分 方法 ， 

在 CREW 算法 中 当 多 处 理 器 对 同一 存储 器 位 置 进 行 写 操作 时 ， 如 果 我 们 不 作 详细 论 
述 ， 并 行 与 的 结果 就 没有 完备 的 定义 。 在 本 章 中 ， 我 们 使 用 公用 CREW 模型 : 当 客 个 处 理 
器 对 存储 只 的 问 一 位 置 进行 写 操 作 时 ， 它 们 写 人 的 必须 是 公用 值 ( 相 网 的 值 }。 在 处 理 这 个 问 
题 的 有 关 文 献 中 ， 在 与 上 述 不 同 的 假设 前 提 下 存在 着 所 种 可 选择 的 PRAM 类 型 ， 包 括 : 

: 任意 型 : 实际 存储 的 是 写 人 的 这 些 值 中 的 一 个 任意 值 。 
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- 优先 级 型 : 存 情 的 是 具有 最 高 优先 级 的 处 理 器 所 写 人 的 值 。 

- 组 全 型 : 实际 存储 的 值 是 写 人 值 的 某 个 特定 组 合 , 

在 最 后 一 种 情况 中 ， 特 定 组 合 是 指 满 足 结 合 律 的 某 种 函数 ， 如 加 法 (存储 写 人 值 的 和 ) 或 
最 大 值 函 数 ( 仅 存 储 窟 人 值 中 的 最 大 值 )， 


闻 步 与 控制 


PRAM 算法 必须 高 度 同 步 以 保证 其 正确 执行 。 如 何 获得 这 一 同步 特征 ?及 外 ，PRAM 
算法 中 的 处 理 器 常常 必须 测试 循环 的 终止 条 件 ， 而 这 一 终止 条 件 又 往往 取决 于 所 有 处 理 器 的 
状态 。 如 和 何 实现 这 种 控制 功能 ? 

许多 并 行 计 算 机 采用 了 一 种 连接 各 处 理 器 的 控制 网 络 , 以 帮助 实现 同步 和 对 终止 条 件 进 
行 测 试 。 在 特定 情况 下 ， 控 制 网 络 实现 这 些 蕊 能 的 速度 可 以 与 路 径 选 择 网 络 实现 对 全 局 存储 
语句 的 速度 一 样 快 。 

为 方便 起 见 ， 我 们 假设 各 个 处 理 器 网 有 严格 同步 的 特征 。 所 有 处 理 器 闻 时 执行 相同 的 语 
杀 ， 处 理 器 执行 代码 的 进度 也 保持 一 致 。 当 我 们 学 习 第 一 个 并 行 算法 时 ， 我 们 将 指出 在 何 处 
我 们 需要 假设 处 理 器 是 同步 执行 的 。 

为 了 能 对 依赖 于 所 有 处 理 器 状态 的 并 行 循 环 终止 条 件 进行 训 试 ， 我 们 假定 控制 网 络 能 够 
在 DID 的 运行 时 间 内 对 并 行 的 禾 止 条 件 进 行 测试 。 在 一 些 文件 中 的 EREW PRAM 模型 没 
有 作 这 一 假设 ， 并 且 测 试 循 环 终 目 条 件 所 需 的 { 对 数 ) 时 间 必 定 包 含 在 整个 运行 时 间 内 { 吕 练 
习 30.1-8)。 在 30.2 节 中 我 们 将 看 到 ，CRCW PRAM 不 需要 用 控制 网 络 来 测试 终止 和 件 : 
它们 通过 采用 并 发 写 操作 就 能 在 D(U) 的 运行 时 间 内 潮 试 一 个 并 行 御 环 是 否 终 止 。 


本 章 概 述 


30.1 节 主 要 介绍 指针 转移 技术 ， 这 一 技术 提供 了 一 种 并 行 地 控制 表 操 作 的 快速 方法 . 
我 们 将 介绍 如 何 运用 指针 转移 技术 对 表 执 行 前 缀 计算 ， 如 何 尽 快 把 表 的 算法 改写 为 适用 于 树 
的 算法 。30.2 节 对 CRCW 算法 和 EREW 算法 的 相对 性 能 作 了 比较 ， 并 说 明了 采用 并 发 存 
储 器 有 取 操 作 可 以 增加 算法 解决 问题 的 能 力 。 

30.3 节 痢 述 了 Brent 定理 ， 该 定理 说 明 如 何 用 PRAM 来 有 效 地 模拟 组 合 电路 。 这 一 节 
还 讨论 了 关于 工作 效率 的 重要 问题 。 并 铀 出 了 把 p 个 处 理 器 的 PRAM 算法 有 兹 地 转化 为 他 
个 处 理 器 的 PRAM 算法 的 条 件 。30.4 节 重 新 讨论 了 对 链表 执行 前 缀 计算 的 问题 , 并 说 明 如 
何 运用 一 种 随机 算法 来 高 效率 地 进行 计算 。 最 后 ，30.5 节 讨 论 了 如 何 运 用 一 种 确定 的 算法 
在 远 小 于 对 数 时 间 的 运行 时 间 内 并 行 地 打破 对 称 性 。 

本 章 中 一 述 的 并 行 算法 主要 来 之 于 图 论 的 研究 领域 。 它 们 仅仅 是 我 们 从 现存 的 大 量 并 行 
算法 中 选 出 少量 代表 算法 。 但 是 ， 本 章 中 所 介绍 的 一 些 技 术 部 是 很 有 代表 性 的 技术 ， 它们 也 
适用 诗 计算 机 科学 的 其 他 领域 中 的 并 行 算法 。 


30.1 ”指针 转移 


在 各 种 PRAM 算法 中 ,涉及 指针 的 算法 是 非常 有 趣 的 。 在 本 节 中 ， 我 们 要 讨论 一 种 称 为 
。 指针 转移 的 技术 ， 应 用 这 一 技术 可 以 获得 有 关 链 表 操 作 的 快速 算法 ， 我 们 要 特别 介绍 一 种 
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Dtig nj 时 间 的 算法 ， 该 算法 用 于 计算 n 个 对 象 组 成 的 链表 中 每 个 对 象 到 表 属 的 臣 离 。 然 后 ， 
我 们 对 该 算法 进行 修改 , 以 在 OUlg 种 的 时 间 内 对 n 个 对 象 组 或 的 链表 执行 “并 行 前 缀 "计算 。 
最 后 ， 我 们 换 讨 一 种 把 有 关 树 的 问题 转化 为 关于 链表 问题 的 技术 ， 后 一 种 问题 可 用 指针 转移 
技术 来 解决 。 本 节 中 的 所 有 算法 都 是 EREW 算法 : 不 震 要 对 全 局 存储 器 进行 并 发 存 取 。 


30.1.1 表 排 序 


我 们 介绍 的 第 一 个 并 行 算法 是 有 关 列 表 的 。 列 表 在 PRAM 中 的 存储 方式 与 普通 的 
RAM 相同 。 为 了 便于 并 行 地 对 列表 中 的 对 象 进 行 操作 ， 我 们 为 每 个 对 象 分 配 一 个 “响应 "处 
理 器 。 假 定 处 理 器 数目 与 列表 中 的 对 象 一 样 多 ， 并 且 第 ii 个 处 理 器 负责 处 理 第 i 个 对 象 。 例 
如 ， 图 30.2(a) 说 明了 -个 由 对 象 序列 <3，4，6，1，0，5> 组 成 的 链表 。 由 于 每 个 对 象 对 
谋 一 个 处 理 器 ， 所 以 表 中 的 每 个 对 象 都 可 由 其 响应 处 理 器 在 O(D 的 时 间 内 对 其 进行 操 
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疼 30.2 运用 指针 转 称 在 DI(lg mn) 时 间 内 求 出 ma 个 对 象 组 成 的 链 大 中 每 个 对 象 到 表 履 的 此 商 


航 定 已 知 一 个 包含 n 个 对 象 的 单 链表 工 ， 我 们 希望 计算 出 表 工 中 的 每 个 对 象 到 表 尾 的 


眠 离 。 更 形式 地 说 ， 如 果 next 是 指针 城 ， 我 们 希望 计算 出 表 中 每 个 对 象 丰 的 值 di， 使 得 ， 
d 占 = { 中 如 果 nextfil] = 了 区 IL 


dfnext[ 说 十 1 如 果 next[il] 关 NIL 
我 们 把 这 一 计算 d 值 的 问题 称 为 表 排 序 问题 。 
解决 表 排 序 问题 的 一 种 方法 是 从 表 尾 把 上 库 离 往 回 传输 。 因为 表 中 从 端 开始 的 第 k 个 
对 象 必 须 等 到 其 后 的 k-1 个 对 象 确定 了 它们 到 表 尾 的 蝶 离 后 才能 确定 其 自身 到 表 尾 的 虐 
离 ， 所 以 这 一 方法 需要 加 (m) 的 运行 时 间 。 实 际 上 , 这 一 解决 方法 是 一 种 串 行 算法 。 
下 协 的 代码 给 出 了 一 种 有 效 的 并 行 算法， 其 运行 时 间 仅 为 O(jg 包 ， 


LIST-RANKICEL) 
fear 和 个 处 埋 器 i， 并 行 地 找 行 


1 

> do 让 next[i] = NIL 

3 then dii]* 避 

才 . 刀 else qd 人 = 

SS while 存在 -人 对象 1， 满足 next[ 关 NIL 


6 do fer 每 个 处 理 器 ij， 并行 地 执行 

了 . 茹 让 mext[i- 夫 =MIL 

8 then 马 [jj< 一 dd[Hdinextj]] 
9 Text[ 庆 < -mext[mext[i 训 


图 30.2 说 明了 算法 是 如 何 计 算出 各 个 上 距离 值 的 。 图 中 的 每 个 部 分 说 明了 执行 第 99 行 
的 while 循环 的 迁 代 操作 以 前 列表 的 状态 。 在 第 一 次 达 代 中 ， 表 中 开头 5 个 对 每 的 指针 不 为 
NIL， 所 以 由 其 响应 处 理 器 分 别 执行 第 8-9 行 的 操 条 。 其 锅 作 结果 见 玫 中 的 人 b) 部 分 。 在 第 
一 次 选 代 中 ， 只 有 前 面 4 个 对 象 的 指针 不 是 NIL， 该 次 选 代 后 的 结果 见 图 中 的 (部 分 ， 在 
第 3 次 选 代 中 ， 只 对 表 中 开头 2 个 对 象 进 行 操 作 ， 最 后 所 有 对 象 的 指针 均 变 为 NIL， 其 结 
果 抑 转 中 的 (d) 部 分 。 

在 第 9 行 中 ， 对 所 有 非 NIL 指针 nextij， 我 们 浆 nexttj<-nexttnext[i 和 ]， 它 实现 的 设计 
思想 称 为 指针 转移 。 注 意 ， 由 于 指针 转移 操作 改变 了 指针 域 ， 因 而 也 就 破坏 了 链表 的 结构 。 
如 果 必 须 保持 链表 结构 ， 则 我 们 可 以 对 next 指针 做 备份 并 使 用 该 备份 来 计算 距离 的 值 。 


正确 性 


LIST-RANK 维持 以 下 不 变 条 件 : 在 第 $-9 行 whilie 循环 中 每 次 选 代 开 始 时 ， 对 每 个 
对 象 1， 如 果 半 以 丰 作 表 头 的 子 表 的 考 个 d 值 求 和 ， 就 得 到 了 从 到 初始 表 工 尾 的 正确 研 
离 。 例 如 ， 在 图 30.2(b) 中 ， 对 象 3 作 表 头 的 子 表 是 序列 <3，6，0>， 其 d 值 分 别 为 2， 
2， 和 1， 它 们 的 和 为 S， 这 就 是 该 对 象 到 初始 表 尾 的 中 离 。 上 述 不 变 条 件 成 立 的 原因 是 当 每 
个 对 象 与 其 在 表 中 的 后 继 进 行 “ 拼 接 " 时 ， 它 把 其 后 继 的 4 值 加 到 自 届 的 d 值 中 ， 

必须 注意 ， 为 使 指针 转移 算法 能 正确 执行 ， 必 须 使 并 行 的 存储 器 存 取 保持 同步 。 每 次 执 
行 第 9 行 代码 可 以 对 数 个 next 指针 进行 更 新 。 我 们 要 求 赋 倩 式 右 边 的 存储 器 读 操 作 ( 读 
next[inext[] 出 现在 赋值 式 左 边 的 任何 存储 器 写 操作 ( 写 next[il) 之 前 。 

现在 让 我 们 看 看 LIST-RANK 是 一 个 EREW 算法 的 原因 。 因 为 每 个 处 召回 至 饮 蜂 
一 个 对 象 ， 所 以 第 2-7 行 的 每 个 读 操 作 和 写 操 作 都 是 互 斥 的 ， 第 8-9 行 的 写 操 作 也 是 如 
此 。 请 注意 指针 转移 维持 下 列 不 变 条 件 : 对 任意 两 个 不 同 的 对 象 1 和 j， 或 者 有 next[ij 二 
nextj， 或 者 有 nexttj=nextjj 关 NIL。 对 初始 表 这 一 条 件 显然 成 立 ， 并 且 通 过 第 9 行 操 作 
该 条 件 一 直 保 持 成 立 。 因 为 所 有 非 NIL 的 next 值 都 是 不 同 的 ， 所 以 第 9 行 中 的 读 操 作 世 是 
五 吓 的 ， 

如 果 所 有 读 弗 作 都 是 豆 斥 的 ， 我 们 就 无 需 假 设 在 第 8 行 中 执行 了 某 种 同步 操作 ，。 特 定 
地 ， 我 们 要 求 所 有 处理 i 只 能 先 读 dli]， 然 后 才能 读 d[nexti 耻 。 有 了 这 种 同步 要 求 ， 如 果 一 
个 对 象 1 有 next 四 和 关 NIL， 并 且 有 另外 一 个 对 象 j 指向 芝 即 next[j= 切 ， 则 第 1 个 读 操作 为 处 
理 器 1 取 得 值 di， 然 后 第 2 个 读 操 作 才 能 为 处 理 器 j 取得 值 dj。 因 此， 所 以 
LIST-RANK 是 -- 种 PREW 算法 。 

从 现在 起 、 我 们 忽略 有 关 同 步 的 细节 描述 并 假定 PRAM 与 其 仍 代 码 设计 环境 都 以 始终 
奶 一 的 间 步 方式 进行 操作 ， 所 有 处 理 器 可 同时 执行 读 操 作 与 写 操 作 。 


下 77 一 


分 本 


我 们 现在 来 让 明 如 果 表 工 中 有 mn 个 对 象 ， 则 LIST-RANK 的 运行 时 间 为 DO(lgam)。 因 
为 初始 化 占 玫 的 娃 问 为 OU， 并 且 while 循环 中 的 每 次 迁 代 所 需 时 间 世 是 COt 和 ， 所 以 只 需 
证 明 总 共有 「 lgn ] 次 夺 代 操作 就 可 以 了 。 我 们 注意 到 关键 是 ;, 指针 转移 的 每 一 步 把 每 个 表 
转化 为 变 错 的 两 个 表 :; 一 个 表 由 偶数 位 置 上 的 对 象 构成 ， 另 一 个 表 和 由 奇数 位 置 上 的 对 象 构 
成 。 基 此 每 个 指针 转移 步 使 表 的 数目 增加 一 悦 而 使 其 长 度 减 为 一 半 。 因 此 ,在 「lgn ] 次 选 
代 结 束 时 ， 所 有 的 表 均 包含 一 个 对 象 .。 

现 酝 假定 第 5 行 中 的 终止 条 件 测试 所 需 时 间 为 DJ), 练习 30.1--8 要 求 描述 一 个 运行 时 
间 为 OUgm) 的 关于 LIST-RANK 的 EREW 实现 方法 ， 并 在 其 伪 代 码 中 显 式 执行 终止 条 件 
的 测试 。 

除了 并 行 的 运行 时 间 外 ， 对 于 并 行 算法 还 存在 另 一 种 有 趣 的 性 能 评介 方法 。 我 们 定义 并 
行 算法 执行 的 工作 为 其 运行 时 间 与 所 需 的 处 理 器 数目 的 积 。 从 直观 上 看 ， 工 作 是 一 个 串 行 
RAM 模拟 并 行 算法 时 所 扫 行 的 计算 量 。 

过 程 LIST-RANK 执行 了 @tnlgn) 的 工作 ， 这 是 因为 它 需 要 nm 个 处 理 器 旦 其 运行 时 间 
为 日 ( lg n)。 关 于 表 排 序 问 题 的 简单 的 串 行 算法 的 运行 时 间 为 @@( 阅 ， 这 说 明 LIST 一 RAINK 
执行 的 某 些 工作 并 不 是 必需 的 ， 但 两 者 公差 一 个 对 数 因子 。 

己 知 一 个 PRAM 算法 A 和 求解 同一 个 问题 的 另 一 种 ( 串 行 或 并 行 ) 算 法 B， 如 果 A 执行 
的 工作 不 超过 B 执行 的 工作 乘 以 一 个 常数 因子 ， 我 们 就 说 算法 A 对 于 算法 B 来 说 高 效 。 如 
果 算 法 A 对 于 串 行 RAM 上 最 好 的 算法 来 说 是 高 效 的 ， 我 们 就 更 简单 地 称 PRAM 算法 入 
高 歼 。 因 为 在 串 行 RAM 上 关 主 表 排 序 的 最 好 算法 的 运行 时 间 为 @tn)?， 所 以 LIST--RANK 
不 是 高 效 的 算法 ， 我们 将 在 30.4 节 中 前 述 一 个 关于 表 排 序 的 高 误 的 并 行 算 法 。 


30.12 列表 的 并 行 前 统 


指针 转移 技术 远 不 止 应 用 于 表 排 序 问题 。29.2 节 说 明了 在 算术 电路 中 如 何 运用 "前 名 ” 
计算 米 执 行 快 速 一 进 制 加 法 。 现 在 我 们 来 探讨 如 何 运用 指针 转移 技术 来 进行 前 钥 计 算 。 有 关 
前 绥 问 题 的 EREW 算法 对 由 个 对 银 组 成 的 表 的 运行 时 间 为 Of lg Dj。 

前 缀 计算 是 根据 一 进 制 中 满足 结合 律 的 运算 符 名 来 决定 的 。 计算 时 输入 为 序列 <xi 
x.，…，Xn> 并 产生 一 个 输出 序列 < 轴 ，yY，…， 厂 >， 满 足 凡 =X， 并 且 对 区 一 2，3，…， 
mn， 有 

7 一 7 
一 X | 国 X 思 1 
换 名 话说， 每 个 凡是 序列 的 头 攻 个 元 素 一 起 “ 相 匀 " 而 得 到 的 ， 因 此 才 有 “前 缀 "这 一 意 尽 。( 
第 -十 扎 章 中 的 定义 里 序列 下 标 由 0 开始 ， 此 处 的 定义 里 序列 标号 由 1 开始 ， 这 一 区 别 并 不 
重要 。) 

作为 前 缀 计算 的 一 个 实例 ， 假 定 m 个 对 象 组 成 的 表 中 的 每 个 元 素 包 含 的 值 为 1， 并 设 的 
表示 普通 加 法 适 算 。 因 为 对 丰 = 1，2，…，nm， 表 中 第 k 个 元 素 和 包含 的 值 为 双 =1， 所 以 前 
缀 计算 后 的 纺 军 为 站 = 帮 ， 即 为 第 上 个 元 素 的 下 标 。 因 此 ， 进 行 表 排 序 的 另 一 种 方法 是 先 把 
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表 辣 倒 (可 以 在 OU) 的 时 间 内 完成 )， 执 行 前 缀 计算 ， 然 后 把 计算 所 得 的 每 个 值 减 !1. 
我 们 现在 说 归 EREW 算法 是 如 何在 OU 的 运行 时 间 里 对 mn 个 对 象 组 成 的 表 进 行 前 
组 计算 的 。 为 了 方便 起 抑 ， 我 们 定义 符号 记 法 : 
攻 ， 计 一 XGOxiiG 并 
其 中 整数 1 和 j 满足 1 和 iji 乏 j 和 nn。 刚 对 K=1，2，…，n， 有 [k，k=， 并 且 对 0 乏 i 拟 j 所 kk 
近世 
[如 =[i，jleoi+1， 匡 
根据 这 -- 符 号 记 法 ， 前 急 计 算 的 目标 就 是 计算 站 =[1， 匡 ，k= 1，2，…，m。 
当 我 们 对 表 进 行 前 缀 计算 时 ， 我 们 希望 输 人 序列 <x， 刀 ，…， 允 > 的 顺序 由 对 象 在 链 
表 中 的 链接 关系 来 确定 ， 而 不 是 由 存 鱼 对 象 的 存储 器 阵列 中 对 象 的 下 标 来 确定 。( 练 习 
30.1-2 监 求 妇 出 一 个 数组 形式 输入 的 前 缘 算 法 。) 下 列 EREW 算法 开始 时 ， 表 工 中 每 个 对 
象 ; 都 有 … 个 由 诺 的 值 台 i]。 如 果 对 象 ; 是 从 表 头 开始 的 第 k 个 对 象 ， 则 x 加 =x 中 输入 序列 
中 的 第 k 个 元 素 。 因 此 ， 并 行 前 缀 计算 产生 y 思 = 闪 = 日 ，k]. 


LIST 一 P 瓜 EFIXIE) 

1 for 每 个 处 理 眶 ij， 并 行 地 执行 

3 do 计 i=.x0] 

3 while 存在 一 个 对 委 1 满足 next] 关 NIL 
4 do tor 狩 个 处 理 嚣 1， 并行 地 执行 
5 do 站 next[iENIL 

折 thetna  y[next[i< 一 Y[ikeoy[mnext[i] 
? mext[i]<--next[nextf 计 


上 述 伪 代码 和 图 30.3 说 明了 这 个 算法 与 LIST-RANK 的 相似 之 处 。 仅 有 的 差别 在 于 初 
始 化 以 及 更 新 值 的 不 同志 或 办。 在 LIST-RANK 中 ， 处 理 器 ji 更 新 其 自身 的 di; 在 
LIST-PREEFIX 中 ， 处 理 器 i 更 新 的 是 另 一 个 处 理 器 的 ynexti]l]。 注 意 ，LIST 一 PREFIX 与 
LIST-~-RANK 一 样 也 是 EREW 算法 ， 因 为 指针 转移 技术 维持 以 下 条 件 不 变 : 对 不 局 的 对 象 
1 和 j， 或 者 nexti]-next[j]， 或 者 next[ij= next[i]= NIL。 

图 30.3 说 明了 while 循环 中 的 每 一 次 类 代 执 行 前 表 的 状态 。 这 一 过 程 保 持 下 列 条 件 不 
变 : 在 第 七 侈 while 循环 执行 结束 时 ， 第 k 个 处 理 器 中 存放 了 [max(1，k-2 直 ID，k],k= 1， 
2，…，n。 在 第 一 次 迭代 过 程 中 ， 除 最 后 一 个 对 象 的 指针 为 NIL 外 ， 表 中 第 帮 个 对 象 均 指 
向 初始 时 的 第 k+1 个 对 象 。 第 6 行使 得 第 X 个 对 象 必 = 1，2，…，n-D 从 其 后 继 中 取得 什 
[k+1，k+1， 然 后 执行 运算 攻 ，kKIk+1，k+l]， 得 到 [k，k+l1l]， 再 把 它 存储 回 其 后 继 中 。 
然后 . next 指针 与 在 LIST-RANK 中 一 样 进 行 转 移 ， 得 到 图 30.3(b) 所 示 的 第 一 次 迭代 后 的 
结果 。 第 二 次 选 代 也 是 娄 估 的， 对 下 = 1，2，…，n-2， 第 上 个 对 象 从 其 后 继 { 册 其 next 域 
的 靳 的 值 所 定义 ) 取 得 值 帮 +1，k+23j， 然 后 把 [k 一 41，K]GeTk+1，Kk+?= 环 一 1，k+2] 存 人 其 后 继 
中 。 结 果 如 赔 30.3(c) 所 示 。 在 第 三 次 也是 最 后 一 次 迁 代 中 ， 只 有 表 的 开头 两 个 对 象 的 指针 
不 是 NIL， 它 和 们 从 其 各 自 的 表 中 分 别 从 其 后 继 取得 相 虚 的 值 。 最 后 的 绪 果 如 图 30.3(d) 所 
示 。 我 们 注意 到 使 算法 LIST-PREFIX 能 够 工作 的 关键 是 在 每 一 步 ， 如 果 我 们 对 每 一 个 存 
在 的 表 进 行 先 缀 计算 ， 则 每 个 对 象 均 包含 正确 的 值 。 
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图 30.3 在 链表 上 并 行 前 针 算 法 LIST-PREEFJX 的 执行 过 程 


ae 


因为 上 面 介绍 的 防 种 算法 运用 了 同样 的 指针 转移 技术 ， 所 以 对 工 IST--PREEFIX 的 分 析 
与 LIST-RANK 相同 : 在 EREW PRAM 上 的 运行 时 间 为 D(lzg nm， 算 法 执行 的 全 部 工作 
为 @(n lgn)。 


3 如.4.3 欧 拉 回 路 技术 


在 本 节 中 ， 我 们 将 介绍 欧 拉 回路 技术 , 并 说 明 如 何 运 用 这 一 技术 在 nm 个 结 点 的 二 屎 树 中 
计算 出 每 个 结 点 的 深度 。 在 这 个 DUg 补 时 间 的 PREW 算法 中 , 关键 的 一 步 就 是 并 行 前 缀 计 
算 。 

为 了 在 PRAM 中 存储 二 义 树 ， 我 们 采用 了 11.4 节 中 述 的 那 种 简单 的 二 叉 树 袁 示 法 。 
每 个 结 点 研 有 一 个 城 parent[i、]lef[l、zrightil， 分 别 措 向 缚 点 工 的 父母 、 左 子女 和 右 子 女 。 
假定 每 个 结 点 用 一 个 非 负 整数 来 表示 。 我 们 为 每 个 结 点 联接 三 个 而 不 是 一 个 处 理 器 ， 其 原因 
我 们 在 下 面 将 会 明白 。 称 这 三 个 处 理 器 为 结 点 的 A，B 和 CC 处 理 器 ， 我 们 可 以 很 容易 地 在 
结 点 与 其 :二 个 处 理 器 之 间 技 出 对 应 关系 。 例 如 ， 结 点 i 可 以 与 处 理 器 3i，3i+1 和 3i+2 相 联 
接 。 

在 串 行 RAM 上 上， 计算 包 含 n 个 结 点 的 树 中 每 个 结 点 的 深度 所 需 运 行 时 间 为 O(m。 采 
腹 一 种 简单 的 并 行 算 法 来 计算 结 点 深度 时 ， 算 法 可 以 从 树 的 根 铺 点 开始 把 一 种 “流向 下 传 
输 。 这 种 波 朵 时 到 达 深 度 相 同 的 所 有 结 点 ， 凡 此 道 过 对 波 载 计数 器 增值 ， 我 们 就 能 计算 出 每 
信 结 点 的 深度 。 这 种 并 行 算 法 对 完全 二 叉 树 很 适用 ， 这 是 因为 其 运行 时 闻 与 树 的 高 度 成 正 
比 。 而 树 的 高 度 最 大 为 nr-1， 这 时 算法 的 运行 时 间 为 @@n)， 这 并 不 优 于 串 行 算法 。 但 是 ， 
如 汝 我 们 运用 欧 拉 回 路 技术 ， 不 论 树 的 高 度 是 多 少 ， 都 能 够 在 EREW PRAM 于 用 OUg m) 
的 运行 时 间 计 算出 结 点 的 深度 。 

一 个 图 的 欧 拉 回 路 是 通过 图 的 每 条 边 一 次 一 个 回路 ， 当 然 , 在 此 过 程 中 它 可 以 雾 次 访问 
一 个 结 点 。 恨 据 问题 23-3 可 知 ， 一 个 有 同 连 通 图 具有 欧 拉 回路 当 且 仅 当 对 所 有 结 点 Y，Y 
的 出 度 等 上 v 的 人 度 。 困 为 无 向 图 每 条 无 向 边 人 ， 妇 对 应 于 相应 的 有 疝 图 中 的 两 条 边 侣 ，W) 
和 (v，u)， 因 此 任何 无 向 连通 图 改 成 的 有 操 图 均 包 含 欧 拉 回路 ， 这 对 无 向 树 也 自然 成 立 。 
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力 30.4 运用 欧 拉 回路 技术 来 计算 每 个 结 点 在 二 尺 树 中 的 深度 


为 了 计算 一 叉 笃 工 中 结 点 的 深度 ， 首 先 在 改写 的 有 向 树 T 中 形成 一 个 欧 拉 回 路 。 该 回 
路 对 应 于 树 的 示 历 过 程 ， 如 图 30.4(aj 所 示 ， 它 可 以 用 一 个 连接 树 中 所 有 结 点 的 链表 来 表 
了 未 。 其 结 柳 如 下 : 
-如果 结 点 的 左 子 女 存 在 ， 则 结 点 的 A 处 理 器 指向 其 左 子女 的 A 处 理 器 ， 知 则 就 指 商 自 
身 的 B 处 理 器 。 
- 如 采 结 点 存在 右 子 ， 则 结 点 的 B 处 理 器 指向 其 右 子 玄 的 A 处 理 器 ,否则 就 指向 其 自 
身 的 尼 处 理 器 。 
如 采 一 个 绪 扎 是 其 父母 结 点 的 堪 子女 ， 则 结 点 的 C 处 理 器 指向 其 父母 的 B 处 理 器 ， 如 
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果 该 结 点 是 苇 父 址 结 点 的 右 子 女 ， 则 结 点 的 CC 处 理 器 指向 其 父母 的 和 处理 器 根据 
址 的 C 处 理 器 指向 NIL.。 

因此 ， 根 据 欧 拉 回 路 形成 的 链表 的 表 头 是 根据 结 点 的 A 处 理 器 ， 表 尾 是 入 据点 的 C 处 
理 器 。 如 条 蕊 知 构成 原始 树 的 指针 ， 则 我 们 可 以 在 DO) 的 时 间 内 构 寺 出 欧 拉 回路 . 

在 我 们 获得 表示 工 的 欧 拉 加 路 的 链表 后 ， 我 们 在 每 个 A 处 理 器 中 放 人 值 1， 在 每 个 了 
处 理 器 中 族人 值 0， 在 每 个 C 处理 器 中 族人 俏 --1， 如 图 30.4(a) 所 示 。 然 后 如 第 30.12 节 中 
那样 ， 我 们 运 上 几 满 中 结合 律 的 普通 却 法 来 执行 并 行 前 缀 计算、 图 30.4(b) 说 明了 并 行 前 缀 计 
和 草 的 结果 。 

我 们 说 ， 在 执行 完 并 行 前 缀 计算 过 程 后 ， 每 个 结 点 的 深度 值 在 结 点 的 C 处 理 器 中 。 为 
什么 呢 ? 我 们 按 以 下 竖 求 把 数 放 人 .A，B 和 CC 三 个 处 理 器 中 : 访问 子 树 的 最 后 结果 是 把 运行 
和 加 上 11。 每 个 结 战 工 的 A 处 理 岂 对 其 左 了 于 女 树 的 运行 和 期 1， 这 表明 i 的 左 子 玄 的 深度 比 i 
的 这 度 大 1. 吕 处 理 髓 对 运行 和 设 有 影响 ， 这 是 因为 i 的 左 子女 的 深度 与 其 右 子 女 的 深度 相 
等 。C 处 理 器 使 运行 和 减 1， 以 便 对 站 的 父母 结 点 来 说 ， 对 以 让 为 根 铺 点 的 子 树 进 行 访问 后 
运行 和 木 会 改变 . 

我 们 可 以 在 DG) 的 时 间 岗 计算 由 表示 了 欧 拉 回路 的 列表 。 列 表 中 包含 3n 个 对 象 ， 所 以 执 
行 并 行 月 组 计算 过 程 仪 背 OUlg mm 的 运行 时 间 。 酚 此， 计算 所 有 结 点 深度 所 花费 的 全 部 运行 
时 间 为 DOtig mn。 立 困 为 算法 执行 中 不 需要 对 有 存储 器 执行 并 发 存 取 操 作 ， 所 以 该 算法 是 一 
个 EREW 狂 法 。 


30.2 CRCW 算法 与 EREW 算法 


并 行 计 算 机 的 硬件 是 否 庶 该 提供 并 发 的 存储 器 存 取 操 作 ? 一 些 人 认为 支持 CRCW 算法 
的 万 件 系 统 过 分 兄 贵 ， 衣 使 用 过 于 频 仁 ， 另 外 一 些 人 则 抱 想 说 EREW PRAM 提供 的 程序 
没 计 借 型 癌 限 性 大 大 。 也 许 这 场 争论 的 最 终 答案 在 于 两 者 之 间 的 权衡 ， 实 际 上 世 出 现 了 数 种 
折 更 模型 。 下面 我 们 来 考察 一 下 并 发 的 存储 器 存 取 操 作 究 竟 给 算法 带 来 了 电 些 优越 性 能 ， 

仕 本 节 中 ， 我 们 将 证 明 用 CRCW 算法 来 解决 某 些 问题 要 超过 用 最 好 的 EREW 算法 来 
解决 同样 的 问题 要 好 。 例 如 ， 对 于 在 树林 中 寻找 树 根 的 问题 ， 允 许 并 发 读 操作 可 以 使 人 们 获 
得 一 种 更 快 的 算法 。 对 于 在 一 个 数组 中 寻找 最 大 元 素 的 问题 ， 人 允许 并 发 写 操作 也 可 以 使 算法 
的 执行 连 度 更 快 。 

并 发 操作 发 挥 作 用 的 有 关 问 题 


假定 已 知 一 个 二 六 树 组 成 的 森林 ， 其 中 每 个 结 点 都 有 一 个 指针 Parentfi] 指 向 其 父母 结 
损 ， 我 们 希望 得 个 结 战 能 找 出 亡 所 在 的 档 的 根 缚 点 。 我 们 把 处 理 器 i 与 森林 下 中 的 每 个 结 点 
i 相 耿 结 ， 上 下 列 指针 转移 算法 把 每 个 结 点 直 所 在 的 树 的 根 结 点 的 值 存 储 在 root 四 中。 


FIND-ROCTSLF) 

1 _ tar 竺 个 外 才 串 i， 并 行 地 执行 
? doifFparent[iL = MIL 

3 then Foect[i]-< 一 ;1 
二 


white 存在 一 个 结 点 1 渡 足 parent[iHENTIL 
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do foer 每 个 处 理 占 i， 并 行 地 执行 6 
do 让 parent[ij-MNIL 
thten root]=Toot[parent[i 
Patent[ij<-parent[Parent[fill 


5 

6 

7 

8 

图 30.5 说 明了 该 算法 的 操作 过 程 。 在 第 1-3 行 热 行 初始 化 操作 后 ， 如 图 30.5(a) 所 示 ， 
知道 根 的 值 的 唯一 结 点 是 根 结 点 上 自身。 第 4-8 行 的 while 循环 执行 指针 转移 操作 ， 并 填 人 
root 域 。 图 30.s(b) 一 (d) 分 别 说 明了 循环 中 的 第 1， 第 2 和 第 3 次 达 代 后 森林 的 状态 。 我 们 
可 以 看 出 ， 算 法 保持 下 列 条 件 不 变 : 如 果 parent[ 计 =NIL， 册 把 该 结 点 的 根 的 值 赋 给 


root[j] 。 





L_ 
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1 史 17 22 5 1 9 13 
则 [6 忆 ， ， 世 ， 0 
， 四 
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赂 30.3 用 一 台 CREW PRAM 在 二 有 树林 林 中 寻找 根 的 过 程 


我 们 说 FIND-ROOTS 是 一 个 运行 时 间 为 DUlg d 由 的 CREW 算法 ， 其 中 是 森林 中 有 具 
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有 最 大 深度 的 树 的 深度。 写 操 作 仅 出 现在 第 3、7 和 8 行 , 并 且 因 为 在 每 个 写 操 作 中 处 理 器 仅 
对 结 上 部 1 全 人 ， 所 以 这 些 好 操作 都 荐 互 床 性 。 但 是 ， 第 7 一 8 行 的 读 操作 是 并 发 执行 的 ， 这 是 
因为 数 个 结 点 的 指针 可 能 指向 同一 个 结 点 。 例 如 在 图 30.5(b) 中 ， 我 们 可 以 看 到 在 while 循环 
的 第 一 次 这 代 中 ，rooet[ 几 和 parent[ 有 同时 被 处 理 器 18，2 和 7 读 出 。 

FIND-ROOTS 的 运行 时 间 为 DC 中 ， 其 理由 与 LIST-RANK 相同 : 每 次 和 代 使 每 
条 路 径 的 长 供 缩 答 -- 半 。 图 30.5 明显 地 说 明了 这 -- 特 征 。 

站 果 只 允许 下 矿 读 操作 ， 则 树林 中 的 nm 个 结 点 要 找 出 其 所 在 二 叉 树 的 根 又 需要 多 少时 
间 ? 我 们 可 以 简单 地 证 明 需 要 OUlg m 运 行 时 间 。 关 键 的 一 点 是 : 当 读 操作 互 斥 时 ，PRAM 
的 每 一 步 只 人 允 注 把 条 已 知 信息 复制 到 存储器 中 的 至 多 一 个 其 他 存储 单元 ， 因 此 每 一 步 执行 
后 包含 该 信息 的 存储 单元 数 公 多 增加 一 倍 。 在 单 棵 树 的 情况 下， 初始 时 至 多 有 一 个 存储 器 单 
元 保存 着 概 的 俯 。 

在 第 一 步 执行 后 ， 圣 多 有 两 个 存储 器 单元 包含 根 的 值 。 执 行 上 步 后 ， 至 多 有 2 个 存 
储 单 元 包含 根 的 值 ， 如 果 怪 的 规模 为 日 叫 ， 则 算法 结束 时 就 需 训 @(m 个 存储 单元 来 存储 根 
的 值 。， 因 此 ， 总 世 查 执行 的 步 数 是 GO(lg o。 

每 当 哥 林 中 各 个 树 的 最 大 深度 d 为 208o 时 ， 从 源 近 意义 上 来 说 ，CREW 算法 
FIND-ROOTS 此 越 过 任何 EREW 算法 。 特别 地 ， 在 一 个 由 na 个 结 点 组 成 的 森林 中 ， 最 大 
深度 的 树 是 - - 柑 其 有 加 (个 结 点 平衡 二 叉 树 ，d=Qlgm， 在 这 种 情形 下 FIND-ROOTS 
的 运行 时 间 为 : Qigtm， 用 任何 EREW 算法 解决 这 一 问题 则 要 QUlg Do) 的 运行 时间。 天 
此 ， 在 这 一 司 题 中 允许 并 发 读 对 :上 我 们 是 有 帮助 的 。 


并 发 写 操作 发 挥 作用 的 一 个 问题 


为 了 让 明 并 发 号 操作 提供 的 性 能 要 优 于 互 斥 写 操作 所 能 提供 的 性 能 ， 我 们 来 考察 一 个 在 
实数 组 成 的 数组 中 寻 打 最 天 元 素 的 问题 。 我 们 将 会 看 到 ， 关 于 这 个 问题 的 任何 EREW 算法 
者 需要 纪 1m) 的 运行 时 间 ， 没 有 代 何 CREW 算法 能 获得 更 好 的 性 能 。 得 是 ， 采 用 一 个 普 
通 的 CRCW 委 法 米 解决 这 一 问题 仪 需 要 DO 时 间 。 在 这 个 算法 中 数 个 处 理 器 可 以 对 同一 个 
存储 单 卫 进行 3 操作 ， 且 生出 的 值 相 同 。 

找 出 n 个 数组 元 素 中 的 最 大 值 的 CRCW 算法 假定 输 人 的 数组 为 AI0..n-Hj。 该 算法 使 
用 了 mm 个 处 理 器 。 对 0<i，j 入 n-1， 每 个 处 理 器 对 A[ 和 AD[] 的 值 进行 比较 。 实 际 上 ， 算 法 
是 对 一 个 比较 托 阵 进行 操作 ， 因 此 我 们 不 仅 可 以 把 这 个 处 理 器 赋予 一 个 一 维 下 标 ， 也 可 
以 把 它们 理解 为 拔 有 一 维 下 标 (i，j， 


中 入 SST 一 MA 区 和) 
na jength [各 ] 
forin 人 ton-] 并 行 地 执行 
domfiis TRUE 
tri< 0ton-landjs 0tonml 并 行 执行 
怒 避让 各个 二 各 全 
then mijil=-E 上 ALSE 
foris 04on 一 1 并 行 要 行 
dunimil=TRUE 
then maxs: 各 [j] 


眉 加 -了 和 1 
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1 return IDSBX 


第 1 行 确定 了 数组 A 的 长 度 ! 它 仅 需 在 一 个 处 理 器 (如 处 理 器 上 执行 。 我 们 设置 了 一 
个 数组 m[0..n-1j，am 上 由 处 理 器 i 响应 。 我 们 希望 mij=TRUE 当 昌 仅 当 Ai 是 数组 A 中 元 
素 的 最 大 值 。 开 始 时 人 第 2-3 行 )， 我 们 把 每 个 元 素 都 当 作 可 能 的 最 大 值 处 理 ， 并 且 依 党 第 5 
行 中 的 比较 操作 以 确定 哪些 元 索 不 是 值 最 大 的 元 素 。 

图 30.6 说 明了 算法 的 余下 部 分 在 第 4-6 行 的 循环 代码 中 ， 我 们 对 数组 A 中 排序 的 每 对 
元 素 进行 检查 。 对 每 对 元 素 Af 和 A[]， 第 5 行 专 看 是 否 有 A[<A[il。 如 果 这 一 比较 式 为 
真 ， 我 们 就 知道 AI 不 可 能 是 最 大 元 素 ， 于 是 在 第 6 行 中 置 m[i]<-FALSE 以 便 记录 下 这 一 
事实 。 可 能 有 数 个 (it，ji 处 理 器 同时 对 ml[j 进 行 写 操作 ， 但 它们 要 写 人 的 都 是 相同 的 值 : 
下 ALSE。 


和 [本 





图 306 用 CRCW 算法 FAST_MAX 在 O(0) 时 间 内 求 由 了 个 值 中 的 最 大 值 


因此 ， 在 执行 完 第 6 行 代码 后 ， 只 有 对 A[] 是 最 大 值 的 下 标 i， 才 有 m 国 =TRUE。 第 7 
到 9 行 把 这 一 最 大 值 存 人 变量 max 中 ， 并 返回 。 可 能 有 数 个 处 理 器 对 变量 max 进行 写 操 
作 ， 但 如 果 是 这 样 ， 它 们 要 写 人 的 都 是 相同 的 值 ， 这 个 条 件 对 于 普通 的 CREW PRAM 模 
型 是 必须 一 贯 保持 的 。 

由 于 算法 中 的 三 个 循环 均 是 并 发 执行 ， 所 以 FAST-MAKX 的 运行 时 间 为 D(D)。 当 然 ， 
它 并 不 是 商 效 的 算法 ， 这 是 因为 它 需要 mr 个 处 理 器 ， 而 用 车 行 算法 解决 这 个 问题 所 需 的 运 
行 时 间 为 @(m。 练 习 30.2-6 将 要 求 说 明 能 够 找到 一 个 更 高 效 的 算法 。 

在 某 种 意义 上 说 ， 过 程 FAST-MAX 的 关键 在 于 一 台 CRCW PRAM 用 了 nan 个 处 理 器 
在 QU) 的 时 间 内 执行 关于 了 个 变量 的 布尔 型 与" 操作。 (因为 普通 的 CRCW 模型 具 符 这 种 
性 能 ， 所 以 具有 更 大 效力 的 CRCW PRAM 模型 更 应 具备 这 一 性 能 。) 实 际 上 ， 上 述 代码 一 
次 执行 了 数 个 “与 "操作 ， 它 对 i 一 0，1，…，m-1， 计 算 : 

mm 人 = 人 (A 国 关 AA 


上 式 可 由 DeMeorgan 定理 (5.2) 推 出 ， 这 一 “与 ?功能 也 可 用 于 其 他 方面 。 例 如 ，CRCW 
PRAM 具有 在 Q(9 的 时 间 内 执行 “与 "操作 的 功能 , 因而 不 需要 用 一 个 独立 的 控制 网 络 来 测 
试 全 部 处 理 器 是 否 都 完成 了 一 次 循环 是 否 结 束 循 环 仅 由 对 所 有 处 理 器 结束 循环 的 要 求 进 行 
与 "操作 的 结果 来 决定 。 

EREW 模型 不 具备 这 种 强 有 力 的 “与 工具。 计算 n 个 元 素 中 的 最 大 值 的 任何 EREW 
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算法 均 需 要 避 ( 韦 呈 的 运行 时 间 。 关 于 这 一 点 的 证 明 从 概念 上 说 类 似 于 寻找 二 叉 树 根 结 点 的 
天 办 的 论证 。 在 那个 证 明 里 ， 我 们 观 寒 有 多 少 结 点 “知道 "其 根 的 值 , 并 证 明了 每 一 步 操 作 至 
多 使 "知道 "的 结 点 数 增加 一 倍 。 对 于 计算 n 个 元 素 中 的 最 大 值 问题 ， 我 们 观察 娜 些 元 素 “ 知 
道 "它们 不 是 最 大 值 ， 从 直观 上 说 ， 在 EREW PRAM 上 的 每 一 步 操作 后 ， 这 一 “知道 "的 元 
素数 目 至 多 减少 一 半 ， 这 样 我 们 就 得 了 下 界 QIlgI。 

令 人 惊异 的 是 ， 即 使 我 们 允许 执行 并 发 读 操 作 ， 计 算 最 大 值 的 运行 时 间 的 下 界 依然 是 
tlg nj)。 亦 即 , 对 CRCW 算法 该 下 界 也 保持 不 变 。Cook， TDwork 和 Reischuk 已 经 证 明 : 
实际 上 ， 即 使 处 理 回 数 具 不 受 限 制 且 存储 器 容量 也 不 受 跟 制 ， 寻 找 mn 个 元 素 中 最 大 值 的 任 
何 CRCW 算法 都 必须 运行 Q(lg 器 的 时 间 。 对 于 计算 n 个 布尔 值 的 “与 ?问题 、 该 于 界 Qi( 培 
n) 也 通用 、 


用 了 工 REW 算法 来 模拟 CRCYW 算法 


现在 我 们 已 经 知道 CRCW 算法 能 够 比 EREW 算法 更 快 地 解决 某 些 问题 。 并 号 , 任何 
EREW 算法 都 能 在 CRCW PRAM 上 执行 。 因 此 , 严格 地 说 CRCW 模型 要 比 EREW 模型 
更 有 效力 。 但 是 其 效力 究竟 有 狗 大 ? 在 30.3 节 中 ， 我 们 将 会 证 明 具 有 bp 个 处 理 器 的 EREW 
PRAM 能 和 金 在 D(lgp) 的 运行 时 间 内 对 p 个 数 进行 排序 。 现 在 我 们 先 运 攻 这 一 结论 来 说 明 相 
对 于 EREW PRAM 来 说 CRCW PRAM 的 效力 的 上 界 。 

定理 30.1 具有 Pp 个 处 理 器 的 CRCW 算法 的 运行 速度 至 多 比 解 决 同 一 问题 的 最 好 的 具 
有 的 p 个 处 理 器 的 EREW 算法 快 Dflg p) 倍 。 

证 妆 : 我 们 采用 模拟 论证 。 用 一 个 运行 时 间 为 Of 地 B) 的 EPREW 计算 过 程 来 模拟 
CRCW 算法 的 每 一 步 操 作 。 因 为 两 种 计算 本 的 处 理 能 为 是 相同 的 ， 所 以 我 们 仅 重 点 讨论 存 
赃 器 存 铺 操作 ， 在 此 我 们 包 对 并 发 写 操作 进行 模拟 以 证 明定 理 。 对 并 发 读 操作 的 模拟 留 作 红 
习 。( 见 练习 30.2-8) 

我 们 引信 一 个 长 度 为 的 数组 A， 使 EREW PRAM 中 的 p 个 处 理 器 模拟 CRCW 算法 
中 的 并 发 写 操 作 ， 图 30.7 说 明了 这 一 思想 ， 对 ii= 人 0 1，…,pL， 当 CRCW 处 理 器 和 要 求 
把 一 个 数据 x; 写 人 存 鳍 单 花 1 时 ， 每 个 相应 的 EREW 处 理 器 p; 把 序 对 作 ，x) 写 人 存储 单元 
A[ 中 .因为 每 个 处 理 器 对 不 同 的 存储 单元 进行 写 操 作 ， 所 以 这 些 写 操 作 都 是 互 斥 的 。 然 
后 ， 把 数组 A 按 莽 有 序 对 的 第 一 个 坐标 在 DClg p) 的 时 间 内 进行 排序 ， 这 样 就 使 得 写 到 同一 
个 存储 单元 的 所 有 数据 在 输出 时 被 放 在 一 起 。 

现在 ， 对 i= 1，2，…，Pp-1， 每 个 EREW 处 理 器 mi 检查 A[i]= (个 ，x)，Af1= 人。 
kr)， 其 中 0 委 j，k 么 p 一 1。 如 果 1 或 1=0， 则 对 ji=1，2，…，B-1， 处 理 串 bi 把 数据 x 
写 到 全 局 存储 器 的 存储 单元 1 中。 否则 处 理 器 不 作 任 何 操作 。 因 为 数组 A 已 按 其 第 一 个 坐 
标 排序 ， 所 以 实际 上 只 有 一 个 对 任何 给 定 存储 单元 执行 写 操 作 的 处 理 器 成 功 地 执行 操作 ， 因 
此 该 写 操 作 是 互 斥 的 。 所 以 这 一 过 程 在 DO(lg 区 的 时 间 里 实现 了 普通 的 CRCW 模型 中 的 并 
发 写 操 作 中 的 每 个 步 又。 (证 毕 ) 

有 关 并 发 写 的 其 他 模型 也 可 以 同样 被 模 氢 。( 见 练习 30.2-9) 

王 是 , 允 出 现 了 这 样 一 个 问题 : 在 CRCW 和 EREW 中 究竟 应 选择 本 一 种 模型 ?如 果 选 
择 CRCW， 则 应 选择 什么 样 的 CRCW 模型 ?CRCW 模型 的 支持 者 指出 ，CRCW 模型 的 程 
序 设 计 要 比 EREW 模型 简单 ， 并 且 运 行 速度 快 。CRCW 模型 的 批评 者 则 争论 说 实现 并 发 
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存储 的 硬件 要 比 实现 互 斥 存储 颖 操作 的 硬件 速度 慌 ， 因 此 CRCW 算法 的 运行 速度 是 不 现实 
的 ， 在 现实 中 无 法 用 OU 的 运行 时 间 找 出 nm 个 值 中 的 最 大 值 . 
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30.7 在 一 台 EREW PRAM 上 模拟 并 发 写 操 作 


另外 还 有 一 部 分 人 认为 PRAM， 不 论 是 EREW 还 是 CRCW， 都 是 完全 不 合适 的 模 
盘 。 各 处 理 必须 由 一 个 通讯 网 络 互 相连 接 ， 而 这 个 通讯 网 络 也 应 该 是 模型 的 一 部 分 。 在 网 络 
中 ， 处 理 器 应 当 仅 能 与 其 相 邻 的 处 理 器 进行 通讯 。 

很 清楚 ， 不 可 能 马上 就 能 找 出 各 种 观点 的 人 都 猎 同 的 “正确 ?并 行 模型 。 但 是 ， 重 要 的 一 
所 是 我 们 必须 认识 到 : 煤 型 仅仅 是 模型 。 在 现实 世界 中 ， 各 种 模型 的 应 几 都 要 受到 不 同 程度 
的 限制 。 和 模型 在 多 大 程度 上 与 工程 学 的 情形 相 匹 配 ， 在 此 模型 上 的 算法 分 析 就 能 在 多 大 程度 
上 天 示 现 实 世 界 中 的 现象 。 因 此 学 习 各 种 并 行 模型 和 相应 的 算法 是 相当 重要 的 ， 随 着 对 并 行 
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计算 领域 的 研究 不 断 发 展 ， 最 终 将 会 产生 趋 于 一 臻 的 并 且 适 合 于 实现 的 并 行 计算 模型 的 规 
范 ， 


30.3 ”Brent 定理 与 工作 效率 


Brent 定理 说 明 我 们 如 何 用 PRAM 来 有 效 地 模拟 组 合 电路 运用 这 一 定理 ， 我 们 就 能 
把 第 二 十 八 章 中 许多 关于 排序 网 络 的 结论 和 第 二 十 九 章 中 许多 关于 运算 电路 的 结论 进行 改写 
以 适合 PRAM 模型 。 对 组 合 电路 知识 不 太 热 悉 的 读者 也 许 希 望 复习 一 下 29.1 节 的 内 容 。 

， 组 合 由 让 是 由 组 合 元 件 构成 的 无 由 网 结 每 个 组 合 元 件 都 具有 一 个 或 多 个 输入 ， 在 本 

， 我 们 假定 每 个 组 合 元 件 仅 有 一 个 输出 。( 具 有 > !1 个 输出 的 组 合 元 件 可 以 看 成 是 k 个 
大风 元件。 和 叉 的 亲人 了 为 于 全 的 天 人 其 输出 馈送 到 的 地 点 个 数 称 为 元 件 的 肩 出 。 在 
本 节 中 我 们 一 般 假定 电路 中 的 每 个 组 合 元 件 具 有 有 限 (O(D) 的 扇 人 ， 但 而 出 数 可 以 不 受 跟 
制 ， 

组 合 电路 的 规模 是 指 它 所 包含 的 组 合 元 件 个 数 。 从 电路 的 输入 到 某 组 合 元 件 的 输出 的 最 
长 路 径 中 组 合 元 件 的 数目 称 为 该 元 件 的 深度 。 整 个 电路 的 深度 是 其 任何 元 件 的 最 大 深度 . 

定理 30.2(Brent 定理 ) 任何 深度 为 4、 规模 为 D 并 具有 有 有 限 记 和 人 的 组 合 电 路 都 能 由 一 
种 p 个 处 理 器 的 CREW 算法 在 On yy p+d) 的 时 间 内 对 其 进行 模拟 。 

证 了 明 : 我 们 把 组 合 电路 的 输入 存储 于 PRAM 的 全 局 存储 器 中 ， 并 且 我 们 为 电路 中 的 每 
个 组 合 元 件 保留 了 一 个 存储 单元 以 有 效 经 过 计算 后 的 输出 值 。 这 样 ， 我 们 就 能 够 在 Of1) 的 
时 间 内 用 单个 PRAM 处 理 器 对 指定 的 组 合 电路 模拟 如 下 ,处 理 器 仅仅 为 元 件 从 相应 于 电路 
输 和 人 存储 器 单元 中 读 人 输入 值 ， 或 司 送 给 它 的 其 他 元 件 的 输出 值 ， 这 样 就 模拟 出 电路 中 的 线 
路 。 然 后 处 理 器 计算 出 组 合 元 件 实现 的 画 数 并 把 结果 写 到 存储 器 的 适当 存储 单元 中 去 。 由 于 
每 个 组 合 元 件 的 扇 人 是 有 限 的 ， 所 以 可 以 在 O(1) 的 运行 时 间 内 计算 出 每 个 函数 ， 

因此 ， 我 们 的 任务 就 是 找 出 关于 p 个 处 理 器 的 PRAM 的 一 种 调度 方法 , 使 得 所 有 的 组 
合 元 件 都 能 在 On / p+d) 的 时 间 被 模拟 。 主 要 的 约束 条 件 是 : 对 于 -- 个 组 合 元 件 ， 直 至 对 其 
有 馈送 的 所 有 元 件 的 输出 都 计算 出 后 , 才能 对 该 元 件 进行 模 氢 。 每 当 被 并 行 模拟 的 数 个 组 合 
元 件 需 要 同一 个 值 时 ， 我 们 就 运用 并 发 读 操 作 . 

由 于 深度 为 1 的 所 有 元 件 仅 依赖 于 电路 的 输入 ， 所 以 初始 时 仅 能 对 这 些 元 件 进 行 模拟. 
一 且 对 它们 的 模拟 完成 后 ， 就 可 以 对 深度 为 2 的 所 有 元 件 进行 模拟 ， 如 此 下 去 ， 直 至 完成 对 
深度 为 d 的 所 有 元 件 的 模拟 操作 。 其 中 最 关键 的 思想 在 于 : 如 果 从 深度 为 1 到 深度 为 ;的 所 
有 元 件 均 已 被 模拟 ， 则 我 们 就 能 并 行 地 对 深度 为 二 1 的 元 件 的 任何 子 集 进 行 模拟 ， 这 是 因为 
它们 各 自 的 计算 过 程 是 相互 独立 的 。 

因此 ， 调 度 策略 是 非常 朴素 的 。 我 们 在 对 深度 为 ;的 所 有 元 件 进 行 模拟 后 才 继续 ， 对 深 
度 为 二 1 的 那些 元 件 进行 模拟 。 在 给 定 的 深度 i 内 ， 我 们 一 次 可 模拟 个 元 件 。 图 30.8 中 
p=2 的 情形 说 明了 这 样 的 策略 . 

现在 让 我 们 来 分 析 这 种 模拟 策略 。 对 i 一 1， 2，…，d， 设 m 是 电路 中 深度 为 i 的 元 件 
数 ， 因 此 


考察 深度 为 的 mn 个 组 合 元 件 。 把 这 些 元 件 分 成 [mayp 1 个 组 ， 其 中 前 | mypl 个 组 
铬 组 包含 p 个 元 件 ， 番 下 的 元 件 (如 果 有 的 话 ) 效 在 最 后 一 组 中 ， 这 样 PRAM 就 可 以 在 O( 
ra_zp 1) 的 时 间 内 对 这 些 组 台 元 件 执行 的 运算 进行 模拟 。 因 此 整个 模拟 时 间 与 下 式 相似 : 
= mi 7 ni 
2 二 < 工 ( 二 + 忆 -2+d 
当 -一 个 组 合 电路 中 每 个 组 合 元 件 的 户 出 为 DO(D) 时 ，Brent 定理 可 以 推广 到 应 用 EREW 
进行 模 折 


有 dePth 





图 30.8 Brent 定理 的 证 明 


推论 隐 .3 任何 识 度 为 4、 规模 为 mn 且 具 有 有 限 的 扇 人 与 忆 出 的 组 合 电路 都 能 在 p 个 处 
中 器 的 EREW PRAM 上 在 On ptrHd) 的 运行 时 间 内 对 其 进行 模拟 。 

证 明 : 运用 与 Brent 定理 的 证 明 过 程 中 相 类 杖 的 模拟 方法 ， 区 别 仅 在 于 对 线路 的 模拟 方 
法 不 同 ， 因 为 在 定理 30.2 中 要 求 执行 并 发 读 操 作 。 对 于 EREW 模拟 方法 来 次 ， 在 计算 出 组 
合 元 件 的 输出 后 ， 该 输出 值 并 没有 直接 被 需要 该 值 的 处 理 器 读 出 ， 而 是 由 模拟 该 元 件 的 处 理 
器 把 其 输出 值 复 制 到 病 要 其 值 的 OU 个 输 人 中 去 。 这 样 一 来 ， 需 要 该 值 的 处 理 器 就 可 以 读 
出 该 值 , 而 此 间 不 会 相互 和 干扰。{ 证 毕 ) 

这 和 神 EREW 模拟 策 略 不 适用 于 扇 出 不 受 限 制 的 元 件 ， 因 为 每 一 步 中 的 复制 操作 所 需 时 
间 大 于 常数 。 因 此 ， 对 于 元 件 的 扇 出 不 受 限 制 的 组 合 电路 ， 我 们 就 需要 并 发 读 操 作 。 (如 果 

合 元 件 足 够 简单 ， 则 扇 人 不 受 跟 制 的 情形 有 时 可 以 同一 种 CRCW 模 报 方 法 来 进行 处 理 。 

见 练 习 30.3 一 1。 ) 


一 489 一 


推论 30.3 为 我 们 提供 了 -- 种 快速 的 EREW 排序 算法 。ARKS 排序 网 络 使 用 OUn 地 问 个 
比较 器 能 对 深度 为 O( gm) 的 n 个 数 进 行 排序 。 由 于 比较 器 均 有 有 限 筷 人， 所 以 存在 一 种 
EREW 算法 ， 该 算法 使 用 nm 个 处 理 器 可 以 在 O(t 菇 的 运行 时 间 内 对 卫 个 数 进行 排序 。( 我 
们 在 定理 30.1 中 运用 了 这 个 结论 以 和 证明 一 台 RREW PRAM 可 以 模 所 一 台 CRCW 
PRAM， 其 速度 至 多 降低 一 个 对 数 因 子 。) 不 幸 的 是 ，O- 记号 中 所 隐藏 的 常数 太 大 ， 以 致 于 
这 种 排序 算法 仅 有 理论 上 的 意义 。 但 是 , 目前 已 发 现 很 多 实用 的 EREW 排序 算法 ， 特 别 值 
得 一 提 的 是 由 Colte 发 现 的 并 行 合并 排序 算法 。 

假定 有 -个 至 多 使 用 Pp 个 处 理 器 的 PRAM 算法 ， 伍 我 们 的 PRAM 仅 有 <p 个 处 理 
器 。 我 们 非常 希望 能 以 一 种 高 效 的 方式 在 wy 个 处 理 器 的 PRAM 上 运行 bp 个 处 理 器 的 算法 . 
通过 应 用 Brent 定理 证 肯 中 用 到 的 思想 ， 就 能 给 出 能 否 运 行 的 条 件 。 

定理 30.4 ”如果 用 到 p 个 处 理 器 的 PRAM 算法 A 的 运行 时 间 为 则 对 任意 P' < 了 ， 
存在 一 个 能 解决 相间 问题 的 具有 p' 个 处 理 器 的 PRAM 算法 ， 该 算法 的 运行 时 间 为 
Ofpt ” p)。 ， 

证 明 : ” 设 算法 A 的 时 间 步 被 编号 为 1，2，…，t。 算 法 A/ 能 在 Q( rp/yPp' ]) 的 时 间 内 
模拟 出 A 的 每 个 时 间 步 i= 1，2，…，t 的 执行 。 因 为 总 共有 + 个 时 间 步 ， 所 以 由 于 P <P， 
整个 模拟 过 程 需要 的 时 间 为 :Of( [pyp ]1=Optyp)。( 证 毕 ) 

竺 法 A 完成 的 工作 为 pt， 算 法 A' 完 成 的 工作 为 (pty p)p'= pb 因此 模拟 过 程 是 高 效 
的 。 因 此 ， 如 果 算 法 A 本 身 是 高 效 的 算法 ， 周 算法 A' 也 同样 是 高 效 的 。 

因此 ， 当 对 于 某 一 问题 开发 高 效 的 算法 时 ， 我 们 无 需 对 不 同 数 目的 处 理 器 建立 不 同 的 算 
-法 。 例 如， 假设 我 们 能 够 证 明 不 论处 理 器 数目 是 多 少 ， 解 决 某 给 定 问 题 的 任何 并 行 算法 的 运 
行 时 间 有 严格 下 界 t， 再 假设 解决 该 问题 最 好 的 串 行 算法 所 做 的 工作 为 w， 则 为 了 获得 所 有 
可 能 的 处 理 数 中 不 的 高 效 的 算法 ， 我 们 对 这 一 问题 只 需 开 发 一 种 使 用 = 名 (wy 个 处 理 器 
的 高 效 的 算法 就 可 以 了 了， 对 pw=o(p)， 定 理 30.4 保证 存在 一 个 高 效 的 算法 。 对 以 = op)， 
木 存在 高 效 的 算法 ， 这 是 因为 如 果 +t 是 任何 并 行 算法 运行 时 间 的 下 界 ， 则 有 
pt= cpt) 一 上 (wj)。 


+ 30.4 高 效 的 并 行 前 绥 计 算 


在 30.1.2 节 中 ， 我 们 讨论 了 一 种 运行 时 间 为 Q( 翅 站 的 ERRW 算法 LIST-RANK， 该 
算法 能 对 由 mn 个 对 象 组 成 的 链表 执行 前 绷 计 算 。 算 法 中 运用 了 nm 个 处 理 秋 ， 执 行 的 工作 为 
@tn lg ni。 由 于 在 一 台 训 行 计算 机 上 可 以 我 们 很 容易 在 @O) 的 时 间 内 进行 前 绥 计 算 ， 因此 
LIST-RANK 并 不 是 商 效 的 算法 。 . 

本 节 中 我 们 要 介绍 一 种 高 效 的 随机 EREW 并 行 前 级 算法 . 算法 使 用 OU y7 区 负 个 处 理 
器 ， 运 行 时 间 为 O(1g m。 因 此 它 是 一 个 高 效 的 算法 。 此 外 ， 由 定理 30.4 可 逢 ， 由 该 算法 可 
立 苑 获得 任意 处 理 右 数 P=Omyv 所 oO) 的 其 他 高 效 的 算法 。 


递归 的 并 行 前 统计 算 


随机 性 并 行 前 级 算法 RANDOMIZED-LIST_PREFIX 使 用 了 Pp=Omy lg 虽 ) 个 处 理 
器 来 对 所 nm 个 对 象 组 成 的 链表 进行 操作 。 在 算法 执行 中 ， 每 个 处 理 器 要 响应 初始 表 中 
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np=G(lg nm 个 对 象 ， 在 递归 执行 开始 以 前 ， 先 把 对 象 任意 地 分 配给 处 理 器 (分 配给 同一 个 
处 理 器 的 对 每 不 一 定 是 相 邻 的 )， 并 且 这 种 “所 有 ”关系 以 后 不 会 变化 . 和 我 们 
假定 链表 是 双 链 接 的 ， 而 对 一 个 单 链表 进行 双 链 处 理 仅 舌 要 O(1) 的 时 间 。 


) 一 F- 本 一 + ae 二 1 本 -一 二 二 三 下 
， | | 计 天 四 昌 ] 本 
1 于 下 忆 -F| 134.31 记 - 百 F 芝 国 -| 15.51 三 -| 5 户 - 再 EE 靖 二 -| 18.81 户 - 下 PT 靖 
国王] 和 | 亲 ie | = PIT mm 站 | | 加 站 -上 mm 让 
下 加 1 1 
下 | 11 必 和 ev 25 | 
(h) HL 下 二 | 因 国 让 时 国 


。 ER : 
EPEIEEaEE PH 中 到 | 
ic} 辣 下 和 二 上 


[1 
1 
再 二 可 
mA 1 [aa 了 0 0 | = 1 
站 | 本 一 本 本 f 和 了 | 
【 司 } | 本 本 汪 国 本 | | 国 下 辣 国 表 sr 了 本 | 芭 相国 1 ”| 本 1 和 
生 上 一 了 国生 加 邓 Eee 二 om 全 下 Eee 时 民 站 四 = 于 】 Te 加 = 和 ee 业主 | 半 有 


图 30.9 对 n=9 个 对 象 组 成 的 链表 , 运用 RANDOMIZED-LIST-PRERIX 进行 草绿 计算 的 过 程 


RANDOMEZED~-LIST-PREFIX 的 主要 设计 思想 是 消除 表 中 的 某 些 对 象 ， 对 相 庶 产 
生 的 链表 执行 递归 的 前 缀 计算 过 程 ， 然 后 通过 与 被 消除 的 对 象 进 行 拼 接 对 其 进行 扩 晨 ， 最 后 
获得 了 初始 表 上 的 前 缀 计算 。 图 30.9 说 明了 这 一 递归 过 程 ， 图 30.10 说 明了 递归 过 程 的 展 
开 。 在 稍 后 的 部 分 中 , 我 们 将 证 明 递 归 的 每 一 阶段 都 遵循 以 下 两 条 性 质 : 

1. 在 属于 某 指 定 处理 器 的 那些 对 象 中 ， 至 多 消 内 其 中 一 个 对 象 。 

2. 两 个 相 邻 的 对 象 不 会 同时 被 消除 。 

在 说 明 如 何 选择 满足 以 上 两 个 性 质 的 对 象 前 ， 让 我 们 更 详细 地 考察 一 下 前 缀 计算 的 执行 、 
过 程 。 假 设 在 递归 的 第 一 步 ， 选 择 链表 中 的 第 k 个 对 象 进行 消除 ， 该 对 象 包含 值 [k，k]， 它 
是 由 链表 中 第 k+l 个 对 象 取得 的 。( 对 于 边界 情形 ， 如 k 是 表 中 的 最 末 一 个 对 象 ， 我 们 可 以 
另外 直接 进行 处 理 。) 值 为 Tk+1，k+l 的 第 k+1l 个 对 象 计算 并 存储 值 [k，Kk+iGe [k+1， 
k+1。 通 过 拼接 ， 我 们 就 从 表 中 消 除了 第 丰 个 对 象 。 

然后 ,过 程 RANDOMIZED-LIST-PREFIX 递归 地 调用 其 自身 以 对 一 个 经 过 * 压 缩 ?的 
Eee { 当 整个 链表 为 空 时 递归 达到 其 最 底层 )。 注 意 ， 关 键 是 从 递归 调用 返回 _ 

， 经 压缩 后 的 链表 中 的 每 一 个 对 象 都 包含 在 其 初始 表 上 执行 并 行 前 缀 计算 所 机 求 的 最 终 正 
约 剩 下 的 工作 就 是 把 先前 被 消除 的 对 象 拼接 回 链 表 中 ， 例如 第 攻 个 对 象 ， 并 对 其 值 进 
行 更 新 . 

在 第 k 个 对 象 被 拼 入 链表 后 ， 可 以 用 第 tk: 个 对 象 的 值 来 计算 出 其 最 终 前 级 值 在 递 
归 调 用 后 ， 第 k--1 个 对 象 包含 值 [1，k-1]， 因 此 值 依然 是 上 kk，K] 的 第 k 个 对 象 仅 需要 取得 值 
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【1，k- 并 计算 出 [1!，k]=[1，k-llBkk, 

困 为 有 性 质 1， 所 以 每 个 被 选择 的 对 象 都 有 一 个 不 同 的 处 理 器 来 执行 磅 出 所 需 的 操作 。 
性 质 2 保证 把 对 象 扩 人 畔 出 时 处 理 器 之 间 不 会 发 生 含混 ( 见 练习 30.4~1)。 这 两 个 性 质 加 在 
一 起 ， 就 能 保证 递归 的 每 -- 步 都 能 用 EREW 方式 在 DID) 的 运行 时 间 内 实现 。 





























本、 


图 30.10 对 nm=9 个 对 象 的 链表 ， RANDOMIZED-LIST-PREEFIX 递归 执行 的 各 货 ， 








选择 要 消除 的 对 象 


过 程 RANDOMIZED-~LIST-PREFIX 是 如 何 选择 要 消除 的 对 象 的 呢 ? 首先 ， 必 须 遵 
循 以 上 两 个 原则 ， 此 外 ， 我 们 希望 选择 对 象 所 希 的 时 间 要 得 (最 好 二 党 和 )， 另外 我 们 还 希望 
选择 尽 可 能 多 的 对 象 。 

下 列 随 机 选择 方法 可 以 满足 这 些 要 求 。 通 过 使 每 个 处 理 器 执行 下 列 步 又 来 选择 我 们 要 求 


ER 
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的 对 象 : 

1. 处 理 器 从 其 拥有 的 对 象 中 选择 一 个 以 前 未 被 选择 过 的 对 象 i， 

2.“ 掀 一 个 印 币 "以 等 概率 地 选择 值 HEAD 或 TAIL。 

3. 如 果 它 选择 了 HEAD， 就 对 被 选择 揭 对 象 i 作 标记 ， 除 非 nextf] 已 被 另 一 个 处 理 器 选 
拌 并 且 其 "她 悉 币 "的 结果 也 是 HEAD。 

放 这 种 随机 方法 来 选择 要 进行 消除 的 对 象 仅 需 OU) 的 时 间 ， 并 且 无 需 执 行 并 发 存储 器 
存 取 操 作 。 

我 们 必须 证 明 这 一 过 程 符合 上 述 两 个 原则 。 容 易 看 出 性 质 1 成 立 ， 这 是 因为 在 可 能 的 选 
拌 中 仅 有 一 个 对 象 被 一 个 处 理 器 选中 。 为 了 说 明 性 质 2 成 立 ， 假 定 选 择 了 两 个 连续 的 对 象 i 
和 nextti， 仪 当 这 上 晨 个 对 象 都 被 其 各 上 自 的 处 理 器 选中 且 * 抛 宣 币 ?的 结果 都 是 HEAD 时 , 才 会 
出 现 这 种 情况 。 人 但是， 站 果 响应 next[ 的 处 理 器 “ 挑 硬币 ?后 结果 是 HEAD、 则 对 象 ; 就 不 会 
被 选中 ， 这 半 假 设 相 耶 盾 。 


分 析 


过 程 RANDOMIZED-LIST-PREFIX 的 每 个 递归 步 需 要 O() 的 时 间 ， 因 此 , 要 对 算 
法 进行 分 析 ， 我 们 仅 需 确定 要 消除 初始 表 中 的 所 有 对 象 需要 执行 多 少 步 就 可 以 了 。 在 每 一步 
中 .一 个 处 理 器 消除 其 挑选 的 对 象 的 概率 至 少 是 17 4。 为 什么 呢 ? 我 们 知道 ， 抛 硬币 得 到 
HEAD 的 概率 为 17 2， 并 且 它 不 选择 next[j]j 或 即使 选择 了 next[ 证 但 抛 硬币 得 到 TAIL 的 概 
率 也 至 少 为 172。 由 于 两 次 抛 便 币 基 相 互 独立 的 事件 ， 所 以 我 们 可 以 将 两 个 概率 相 乘 ， 从 
而 得 到 处 理 器 消除 它 所 挑选 的 对 象 的 概率 至 少 是 17 4。 因 为 每 个 处 理 回 拥有 Gf lg 由 个 对 
逐 ， 所 以 一 个 处 理 器 消除 其 所 拥有 的 全 部 对 象 的 期 望 时 间 为 @flg 

不 地 的 是 ， 这 一 简单 分 析 并 不 能 说 明 过 程 RANDOMIZED-LIST-PREFIX 的 期 望 运 
行 时 间 就 是 @Ulg mm。 例 如 ， 如 果 大 多数 处 理 器 很 快 就 消除 了 它们 拥有 的 全 部 对 象 , 但 还 有 
-一些 处 理 器 要 花 长 得 多 的 时 间 才 能 完成 这 一 任务 ， 则 一 个 处 理 器 消除 其 拥有 的 全 部 对 象 的 平 
均 时 间 可 能 依然 是 @@(jg m， 但 算法 的 运行 时 间 就 可 能 很 长 。 

虽然 上 述 简 单 分 析 方 法 不 能 说 明 问 题 ， 但 是 过 程 RANDOMIZED-LIST--PREFIX 的 
期 望 运 行 时 间 的 确 基 @(lg nm。 我 们 将 运用 大 概率 方法 来 证 明 对 某 个 常数 c， 所 有 对 象 在 递 
扫 过 程 的 clgn 步 内 都 被 消除 的 概率 至 少 是 1-17 n。 练 习 30.4-4 和 30.4-$ 要 求 推广 这 一 - 结 
论 , 从 而 让 明 其 期 望 运 行 时 间 的 界 为 @(lg D)。 

我 们 的 大 概率 论 方法 基于 以 下 观察 : 某 指定 处 理 器 消除 其 挑选 的 对 象 的 试验 可 以 看 作 一 
个 们 努力 试验 序列 ( 见 第 六 章 }。 如 果 对 象 被 选中 以 便 消除 , 则 试验 成 功 ; 否则 试验 失败 。 因 为 
我 们 感 兴 趣 的 是 证 明 概 率 比 较 小 . 即 成 功 的 次 数 很 少 , 所 以 可 以 假定 试验 成 功 的 概率 就 是 
174， 面 不 是 侍 少 17 4。( 关 于 对 类 似 假 设 的 正式 的 证 明 ， 请 参见 绒 习 6.4-8 和 得 4-9。) 

为 了 使 分 析 更 简单 ， 我 们 假定 有 ny lgn 个 处 理 器 ， 每 个 处 理 器 响应 链表 中 lgm 个 对 
象 。 对 某 个 将 要 确定 常数 c， 我 们 进行 clgnm 次 试验 ， 并 且 我 们 妈 对 试验 成 切 的 次 数 少 于 ]e 
a 这 一 事件 感 兴趣 ， 设 X 是 一 个 表示 成 功 的 总 次 数 的 随机 变量 。 根 据 推 论 6.3， 可 知 在 clg 
和 次 试验 中 ， 一 个 处 理 器 消除 的 对 象 数 至 少 于 8n 这 一 事件 的 概率 至 儿 为 : 
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一 tx“n 。 

其 中 只 此 cz20。 (第 2 他 可 由 不 等 式 (6.9) 推 出 。) 国 此 ,在 clgn 砂 后 ， 属 于 某 个 指定 
的 处 理 器 所 有 对 象 还 没有 被 全 部 消除 的 概率 至 多 为 17 mm 

我 们 现在 戎 户 得 到 在 clgn 步 后 ， 属 于 所 有 处 理 器 的 所 有 对 象 还 没有 被 完全 消除 的 概率 
的 界 。 根 据 Beofe 不 装 式 (6.22)， 这 一 概率 至 多 是 每 个 处 理 器 未 消除 其 拥有 的 对 象 的 概率 之 
和 和 。 因 为 益 共 有 my ln 个 处 理 器 ， 并 且 每 个 处 理 器 未 消除 其 所 有 的 对 象 的 概率 至 多 为 
1 7 全 让 此 任何 处 理 器 都 没有 完成 其 拥有 对 象 的 消除 操作 的 概率 至 多 为 ， 

科 
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lgn nm 旦 . 

记 是 . 我 们 证 明了 在 OU m) 次 递归 调用 后 ， 每 个 对 象 都 被 从 链表 中 删除 的 概率 至 少 是 
1-17 a。 因 为 每 次 递 虹 调用 所 需 的 时 间 为 DU)， 所 以 在 较 大 概率 上 来 说 ， 过 程 
RANDOMIZED-LIST-PREEFIX 的 迁 行 时 间 为 OClg m。 

在 运行 时 浊 c ln 中 的 常数 ez>20 对 实际 应 用 来 说 似乎 大 了 一 些 。 事 实 上 上， 这 - .常数 与 
其 说 是 对 算法 性 能 的 反 朵 ， 述 不 如 说 它 是 我 们 的 分 析 需 要 的 产物 。 在 实际 运用 中 ， 算 法 的 速 
庶 是 较 快 的 。 我 们 在 分 析 中 取 较 大 的 常数 因子 是 因为 一 个 处 理 器 完成 其 拥有 的 全 部 对 象 的 消 
除 操 作 这 一 堵 件 依 瑚 于 另 一 个 处 理 器 完成 其 所 有 工作 这 一 事件 。 办 为 存在 这 些 相 互 依 顿 关 
系 ， 所 以 我 们 采用 Boole 不 等 式 ， 它 不 要 求 事件 是 相互 独立 的 ， 但 产生 的 常数 要 比 我 们 一 般 
在 实际 中 能 应 出 的 凋 数 弱 一 些 。 


30.5 确定 的 打破 对 称 性 问题 


考察 这 样 一 种 情况 : 两 个 处 理 器 都 希望 对 某 个 对 象 执 行 互 斥 的 存 取 操 作 。 这 两 个 处 理 器 

如 全 才能 确定 哪 一 个 度 该 首先 执行 存 取 操作 ? 我 们 不 希望 出 现 这 样 丙种 调度 方案 ， 两 个 处 理 

扣 都 被 授 存 取 权 , 或 者 因 个 处 理 体 都 不 被 授予 存 取 权 。 在 两 个 处 理 器 中 选择 一 个 的 问题 就 

是 打破 对 称 性 问 是 的-- 个 实例 。 我 们 都 看 到 过 , 当 两 个 人 企图 同时 通过 一 道门 时 所 产生 的 暂 

计 性 混乱 和 慨 问 。 并 行 算法 的 设计 中 类 似 的 打破 对 称 人 性 问题 ， 其 有 效 的 解决 方法 将 是 非常 有 

用 的 . 

打破 对 称 性 的 -种 方法 是 通过 * 抛 硬币 "来 决定 结果 。 在 计算 机 中 ， 可 用 随机 数 生 成 程序 

来 实现 抛 重 币 的 功能 。 对 下 个 处 理 器 的 例子 来 说 ， 两 个 处 理 办 都 可 以 抛 和 硬币 。 如 果 其 中 一 个 

获得 HEAD 而 另 一 个 获得 TAIL， 则 获得 HEAP 的 处 理 器 先 执 行 。 如 果 两 个 处 理 器 获得 相 

同 的 结果 ， 则 再 次 然 硬 币 来 决定 。 采 用 这 种 策略 ， 就 可 以 在 固定 的 期 望 时 间 内 打破 对 称 性 
(多 练 避 30.5 一 1)。 

在 30.4 节 中 我 们 已经 看 到 了 随机 化 策略 的 作用 。 在 过 程 RANDOMIZED- LIST-- 
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PREFIX 中 ， 不 能 选择 表 中 相 邻 的 对 象 进行 消 除 操 作 ， 但 应 该 选择 出 尽 可 能 多 的 满足 条 件 
的 对 象 。 但 是 ， 在 一 个 被 挑选 对 象 组 成 的 链表 中 ， 所 有 对 象 似乎 都 一 样 。 正 如 我 们 所 看 到 
的 。 随 机 化 提供 … 种 简单 而 有 效 的 方法 以 打破 表 中 相 邻 对 象 之 间 存 在 的 对 称 性 ， 同 时 又 能 保 
证 从 较 大 概率 上 说 ， 很 多 对 象 都 能 被 选择 到 。 

在 本 节 中 ， 我 们 考察 一 打破 对 称 性 的 确定 性 方法 。 算 法 的 关键 在 于 它 运 用 了 处 理 器 下 标 
或 存储 地 址 而 不 是 随机 的 抛 厂 币 的 方法 。 例 如 ， 在 两 个 处 理 器 的 实例 中 ， 我 们 可 以 通过 让 下 
标 较 小 的 处 理 器 先 执行 -一 其 处 理 时 间 显 然 为 常数 - 一 来 打破 对 称 性 。 

在 由 nm 个 对 象 组 成 的 链表 中 打 彼 对 称 性 的 算法 也 采用 了 同样 的 思想 ， 但 其 运用 方式 更 
加 聪明 ， 算 法 的 目标 是 从 表 中 挑选 出 恒定 的 一 部 分 对 象 但 避免 选择 两 个 相 邻 对 象 。 这 一 算法 
可 以 由 mn 个 处 理 器 的 确定 的 EREW 算法 在 O(lg mn") 的 运行 时 间 内 执行 。 因 为 对 所 有 nm 忒 
>e53， 有 塌 “na 委 5$， 所 以 对 所 有 的 实际 应 用 ， 值 地 "na 可 以 看 成 一 个 很 小 的 常数 ， 

我 们 的 确定 的 算法 分 为 两 上 部 分 ， 第 一 部 分 在 O(1g “器 的 运行 时 间 内 计算 出 链表 的 “6- 
着 色 "。 第 -部 分 在 O(D 的 时 间 内 把 6 着色 转化 为 表 的 “最 大 独立 集 *。 该 最 大 独立 集 将 包 
含 链表 中 n 个 对 象 的 一 个 恒定 的 部 分 ， 并 且 集 合 中 的 任何 两 个 对 象 都 不 相 邻 . 


着 色 与 最 大 独立 集 


无 向 图 G(V， 下 ) 的 一 个 着 色 是 一 个 函数 C: VN， 满 足 对 所 有 u，vECV， 如 果 
Cu)=Ctv)， 则 (u，v 疾 E， 即 没有 邻接 顶点 有 着 相同 的 颜色 。 在 对 链表 进行 6~ 着 色 时 ， 所 
有 的 颜色 都 属于 集合 10，、1，2，3，4，5 咎 ,并且 没 有 两 个 连续 的 结 点 有 着 相同 的 颜色 。 事实 
F， 对 任何 链表 都 可 进行 ?2- 着 色 ， 这 是 由 于 我 们 可 以 对 所 有 序号 为 奇数 的 对 象 著 色 0， 对 
厅 号 为 偶数 的 对 象 考 色 1。 运 必 并 行 前 缕 计 算 , 我 们 可 以 在 OUlg nm 的 时 间 内 完成 这 样 的 着 
色 ， 但 是 在 许多 应 用 中 ， 人 奴 计 算出 一 种 OU)- 着 色 就 足够 了 。 我 们 将 证 明 无 需 使 用 随机 化 操 
作 , 就 可 以 在 OIC“ 外 的 运行 时 间 内 计算 出 6 着 色 。 

图 G(V，、BE) 的 独立 集 是 结 点 的 一 个 子 集 YEV , 且 满 足 了 中 的 每 条 边 至 密 与 V' 中 一 个 
结 点 相关 联 ， 最 大 独立 集 或 MIS 是 一 个 满足 下 列 条 件 的 独立 集 W/: 对 所 有 缚 点 vE V-V'， 
集合 V 改 用 vi 不 是 独立 集 一 一 每 个 不 在 V“ 中 的 缚 点 与 V“ 中 的 某 个 结 点 相 邻 。 不 要 把 计算 最 
大 独立 集 的 问题 与 计算 最 大 规模 独立 集 问题 相 混 斌 ， 前 者 是 一 个 容易 解决 的 问题 ， 后 者 是 一 
个 较 难 解决 的 问题 .在 普通 的 图 中 找 出 规模 最 大 的 独立 集 的 问题 是 NP- 完 全 的 。( 参 见 第 三 

六 章 中 对 NP- 完 全 性 的 讨论 。 问 题 36--#! 涉及 最 大 规模 独立 集 问题 。) 

对 mm 个 对 象 组 成 的 列表 ， 使 讲 并 行 前 续 计 算 可 以 在 QUg 可 的 运行 时 间 内 确定 最 大 规模 
h 立 集 ( 也 是 最 大 独立 集 )， 如 在 上 面 提前 的 2- 着 色 问 题 中 ， 就 可 以 标 出 序号 为 奇数 的 对 
PR。 这 种 方法 选择 了 Fno72 ] 个 对 象 。 但 是 注意 ， 一 个 链表 的 任何 量 大 独立 集 至 少 包 含 
3 个 对 辊 。 这 是 因为 对 任何 沽 个 连续 的 对 象 ， 至 少 有 一 个 必须 在 集合 中 。 不 过 ， 我 们 将 
EE 明 如 果 给 定 链 表 的 O(D) 着 色 ， 则 可 以 在 DGD) 的 时 间 内 确定 链表 的 最 大 独立 集 ， 


计算 6- 着 色 问 题 
算法 SIX-COLOR 计算 一 个 链表 的 6 着色， 我 们 将 不 给 出 该 算法 的 代码 ， 但 会 比较 详 


晶 地 对 该 算法 进行 描述 。 假 定 初 始 时 链表 中 的 每 个 对 象 x 都 联接 着 一 个 不 同 的 处 理 器 P(x) 
和 如，、1，…、m 一 二 。 
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SIX-COLOR 的 设计 思想 是 对 链表 中 的 每 个 对 象 荆 计算 出 一 个 着 色 序 列 Co[xl，Ci[xl， 
|， 坷 始 的 着 色 Co 是 一 个 m 呈 着 色 。 算 法 的 每 砍 欠 代 过 程 中 邦 在 先前 的 着 色 扬 , 的 基 
击 上 定义 一 个 新 的 着 色 Ci，k=0，1，…，m-1。 最 后 的 着 色 C， 是 一 个 6 着 色 。 我 们 将 
让 明 mm=OLlg “中 )。 

1 是 人 er aer 到 人 er 了 让 er 和 Fer 


inilial .ae 1 .arer 2 processing Processing Proeessing PrDeessin PICces5in 才 ProcessinBg 
Shortng Ion Eratons nort 人 eolorool colorftlI0O eol Dll eolertg eolor10i 


三 


人 


ol 





图 30.11 “在 一 链表 中 打破 对 称 性 的 算法 SIX-COLOR 和 IIST_-MIS 的 质 行 过 程 


初始 的 着 色 是 一 个 容易 获得 的 n~ 着 色 , 其 中 Co[Ix]=P[xl]。 本 为 表 中 没有 两 个 对 象 具 有 间 
一 种 颜色 , 所 以 示 中 没有 天 个 相 邻 的 对 象 具有 同一 种 颜色 , 因此 这 种 着 色 是 合适 的 。 注 意 , 初 
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始 的 每 一 种 着 色 光 可 用 [lgn 1 位 来 描述 , 这 说 明 它 下 以 存储 在 一 个 普通 的 计算 和 机 字 中 。 

随后 的 着 色 可 以 这 样 来 效 得 : 对 =0，1，…，m-1， 第 飞 侈 选 代 开 始 时 着 色 为 CC 结 
束 时 着 色 为 Ci， 这 时 每 个 对 象 使 用 的 位 数 比 开始 时 少 ， 如 图 30.11 的 第 一 部 分 所 示 。 假 定 
某 次 达 代 过 程 开 始 时 ， 每 个 对 象 的 着 色 C， 需要 上 位。 我 们 通过 在 链表 中 向 前 查询 next[x] 药 
颜色 来 确定 对 象 六 的 新 的 颜色 。 

更 精确 地 说 ， 假 设 对 每 个 对 每 和 有 Ca[g=a Cu[next[x]=b, 其中 a= <a li aa， 
au> 和 bb= <bvb .bo> 都 是 rr 位 的 颜色 。 因 为 Ci[ 叶 并 Cnext[x]， 所 以 至 少 存在 某 个 
序号 i 使 得 疝 种 颜 鱼 丰 相同: ai 和 bi。 因 为 8 科 i 委 二 1， 所 以 我 们 能 够 仅 用 lgn 1 位 宕 出 ii 
i= <iyicriaio>。i 与 位 aa 拼接 所 得 到 的 值 可 用 来 对 x 重新 着 色 , 即 ， 

Cellgj= <iai> 二 <irgrl_oargr1-2 iogi>> 

链 - 才 的 未 结 点 的 新 产 色 为 <0，a> 。 因 此 , 每 种 新 颜色 的 位 数 至 多 为 「lgr 1+1， 

我 们 必须 证 明 如 果 过 程 SIX-COLOR 的 每 次 选 代 过 程 开始 时 具有 一 个 着 色 ， 则 它 
的 新 的 “着 色 "* 的 确 是 一 个 合法 着 色 。 为 了 证 明 这 一 点 ， 先 证 明 : 车 Cl[xjC[next[xlj， 刻 说 
明 Ci[ 关 Ci[next[g 可 假设 C[ 双 =a，Cunext[x] =b， 并 且 Ci[ 双 =<i， 册 >， 
Cifnext[xzjj= <j，b> 。 有 了 商 种 情况 需要 考虑 ; 如 果 i 寺 ij， 则 <i，ai> 关 <j，bi> ， 所 以 新 
的 颜色 超 玫 不 相同 的 : 如 乐 1=j， 根 据 我 们 的 重新 着 色 方 法 有 ab=b， 因 此 新 的 颜色 起 狼 
是 下 不 相 同 的 .【 对 于 表 尾 的 情形 可 以 进行 类 似 处 理 。) 

过 程 SIX-COLOR 运用 的 革新 着 色 方 法 取 一 种 守 位 颜色 并 用 一 种 ( 「1gr 1+H) 位 类 色 米 
代 符 它 ， 这 意味 着 只 要 rz4， 其 位 数 就 会 严格 减少 。 当 T= 3 时， 两 种 颜色 可 以 用 位 的 位 置 
0，1 或 2 来 进行 区 别 。 因 此 ， 每 种 新 颜色 是 <00>，<01> 或 <10> 与 0 或 1 连接 而 成 ， 
因此 仍然 得 到 -个 3 位 数 。 人 是 在 3 位 数 的 8 种 可 能 的 值 中 ， 我 们 仅 用 了 6 种 ， 央 此 过 程 
SIX-COLOR 终结 时 确实 是 6 着 色 。 

假定 每 个 处 理 器 能 在 OU 的 时 间 岗 确定 出 适当 的 下 标 ,并 能 在 OU) 的 时 间 执 行 一 个 磊 移 
操作 一 一 许多 实际 的 让 算 机 都 普遍 支持 这 一 操作 -一 - 则 每 次 千代 带 要 DiD 的 时 间 , 过 程 
STIx-COLOR 是 - -个 EREW 算 落 :对 每 个 对 象 ,其 处 理 器 仅 对 奔 和 next[x] 执 行 存 取 操 作 。 

最 后 ， 注 我 们 米 看 看 为 什么 把 初始 的 n 一 着 色 简 化 为 6 着 色 仪 融 昔 OIL“ 中 次 适 代 过 
程 ， 我 们 蕊 经 定义 过 l8“"“n 是 为 使 其 值 减 小 到 坚 多 为 | 入 要 把 对 数 函 数 翅 作用 士 的 次 
效 ， 或 者 设 妇 "nm 横 示 连续 在 次 诬 用 地 函数 ， 认 : 

lg “na=minfi 关 0，lgon 近 二 

设 nm 是 在 第 i 次 选 代 过 程 前 着 色 中 的 位 数 ， 我 们 将 用 归纳 法 证 明 如 果 FTn 132， 则 1 
和 flgan 1+2。 初 始 时 我 们 有 ms Tilgn 1。 第 i 次 克 代 过 程 着 色 中 的 位 数 减 少 为 fi= [ 
tm 1+1。 息 定 对 mm 站 羡 ， 我 们 有 


了 一 Tigr 


扣 


Tlg sa n 1 二 2 1+1 
flgllg' n+31+1 
rig(2tg an) 1 二 1 
fig(lg' nm 1+1+1 


锥 如 


= ng n1+2? 
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由 假设 rig"n 1> 2 可 得 第 4 行 成 立 ， 这 意味 着 ， Tigcnn 13> 3。 因 此 ， 在 执行 m 
= kg 步 后 ， 因 为 由 ]g ”函数 的 定义 有 18 "ns 和 1， 所 以 着 色 中 的 位 数 是 r < flg"n 1] 
+ 2=3。 国 此 ， 浊 多 和 峭 进 行 -次 迁 代 就 足 可 以 产生 6 一 着 色 。 因 此 过 程 SIX -- COLOR 总 
的 运行 时 间 为 OUg mm)。 

根据 6- 蔷 色 计 算出 MIS 


着 色 问 题 是 打破 对 称 性 疝 题 中 较 困 难 的 一 部 分 。 如 果 纵 定 一 个 c 着 色 和 一 个 由 mn 个 对 
象 组 成 的 链表 ， 则 EREW 算法 LIST-MIS 使 用 mn 个 处 理 器 ， 能 在 De 的 运行 时 间 上 内 找 出 
最 大 多 立 集 ， 央 此 一 日 我 们 计算 出 一 个 链表 的 6 一 着色， 就 能 各 在 DID) 的 时 间 里 找 出 该 链表 
的 最 大 独立 集 ， 

图 30.11 的 后 -部 分 说 明 隐 含 在 LIST--MIS 过 程 中 的 设计 思想 。 给 定 的 是 一 个 cr- 着色 
CC。 对 等 个 对 得 x， 我 们 设置 一 个 位 ahive[x， 它 告诉 我 们 x 是 否 恢 然 可 被 选 人 MIS。 初 始 
时 ， 对 凑 有 对 象 x，aiive[xj=TRUE。 

算法 对 ee 种 颜色 中 的 每 一 种 进行 选 代 。 在 相应 于 颜色 i 的 选 代 过 程 中 ， 啊 应 一 个 对 银 科 
的 每 个 处 理 器 检查 是 徊 有 C[xj=i 和 alive[x=TRUE。 如 果 两 个 条 件 都 成 立 ， 则 该 处 理 器 把 
x 标记 为 局 二 详 在 构造 中 的 MIS。 所 有 与 加 人 MIS 中 的 对 象 相 邻 续 的 对 象 的 alive 位 被 置 为 
FALSE: 它 他 不 可 能 属 王 MIS, 因为 它们 与 MIS 中 的 某 个 对 象 相 邻接 。 在 全 部 e 次 选 代 执 行 
完 后 ， 每 个 对 锭 或 者 被 “ 消 火 " 一 一 其 alive 位 已 被 置 为 FALSE 一 一 或 者 被 族人 MIS 中 。 

我 们 必须 证 明 所 产生 的 集合 是 独立 的 和 最 大 的 。 为 了 谱 明 它 是 独立 集 ， 我 们 健 设 有 两 个 
相 邻 对 象 x 和 next[x] 补 一 起 放 人 该 集合 中 。 因 为 它 是 相 令 的， 并 且 是 一 个 着 色 ， 所 以 有 
ec[xj=c[next[agl。 不 失 - 般 性 ， 我 们 人 鼻 定 ctxj<e[naextg]， 这 样 x 在 nextlx 之 前 被 放 和 人 集合 
中 。 但 性 祥 一 来 考虑 到 颜色 为 c[next[txj] 的 对 象 时 ，alivelnextig] 已 税 置 成 FAELSE， 所 以 
next[x]j 不 可 能 被 放 到 集合 中 。 





是 ， 避 秽 拒 y 收入 该 集合 中 的 唯一 方法 是 当 其 相 邻 对 象 被 放 人 集合 中 时 y 已 被 消灭 。 由 于 根 
据 候 设 ，x 和 都 没有 被 放 人 集合 中 ， 所 以 在 对 颜色 为 cty] 的 对 象 进行 处 理 时 ， 对 象 y 的 
alive 位 必 为 任 然 是 TRUE。 所 以 它 必 定 已 被 放 到 MIS 中 。 

在 - 台 PRAM 上 ， 过 程 LIST-MIS 的 每 次 迭代 过 程 需 要 OU) 的 时 间 。 因 为 每 个 对 象 
仅 对 其 和 身 ， 其 表 中 的 前 站 和 后 继 进行 存 取 操作 ， 所 以 该 算法 是 一 个 EREW 算法 ， 如 果 失 
LIST-MI1S 5 SIX-COLOR 结合 起 来 使 用 ， 我 们 就 能 够 在 Of “D) 的 运行 时 间 内 确定 地 打 
厂 一 个 链表 中 的 对 称 性 . 


思 考 题 


苦 -1 分 自 辐 并行 前 埋 
本 普 焉 前 绿 计 算 相 似 ， 分 段 的 前 缀 计算 也 是 用 一 个 满足 结合 律 的 二 进 制 运算 符 @@ 来 定义 
的 ， 它 有 -个 输入 序列 x= 一 <x，x，…，xXn 《其 元 素 属 于 域 S) 和 一 个 段 序列 b= <bi，hb， 
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…，b>( 呈 于 条 局 于 城 10，1， 有 卫 = 和 。 它 产生 一 个 域 $ 土 的 输出 序列 y= <Yi，y2， 
ya>。b 的 各 人 对 x 和 确定 了 段 的 划分 ， 新 段 从 证 =1 的 地 方 开始 。 如 果 bi=0 则 是 
齐 段 的 继续 ， 分 段 人 前 缀 计算 在 x 的 每 个 段 中 独立 地 执行 前 绢 计算 以 产生 y 中 相 庶 的 段 。 图 
30.123 说 明了 上 出 普 赴 如 法 进行 分 自前 组 计算 的 一 个 例子 。 


由 = 下 中 人] 贱 0 上 站 让 和 fn nb 和 1 下] 0 
和 2 了 | 5 夏 了 具 二 IT Il ta 和 4 
y# = 1 了 丰 过 号 和 0 


提 30.12 答 入 为 庆 列 x、 输 出 为 岩 列 了 并 且 分 为 5 段 的 分 段 前 绢 计算 过 程 


4， 在 有 至 类 人 a， 下 ，t4，z)Ef10，1 xxS 上 定 尽 运算 符 鸭 如 下 : 
~ ， ， 1@，z@@ 帮 划 果 一 站 

(a， 妆 人 坊 们 ， 2 一 2 如 果 a = 1 
让 明 适 算 符 久 满 足 结 合 律 。 

b. 下 说 明 如 何在 一 台 下 REW PRAM 上 在 QIED 时 间 内 对 让 mn 个 区 过 组 成 的 列表 执行 
分 段 前 缀 计 狂 。 

“， 试 撕 述 -个 运 行 时 间 因 中 作 讶 菇 的 EREW 算法 以 对 一 个 由 了 工 个 位 数组 成 的 搓 圾 进 
和 排序 ， 

30--2 处 理 器 效率 的 最 大 值 算法 


我 们 帝 记 在 一 台 CRCW PRAM 上 上 用 Pp=ma 个 处 理 器 找 出 个 数 中 的 最 大 销 。 

a.， 证 明 : 丰台 具有 个 处 理 器 的 CRCW PRAM 上 ,能 在 O(b 的 运行 时 间 办 把 找 册 mm 
和 ny 2 个 数 中 的 最 大 傅 问 题 转化 为 罕 多 在 加 "7p 个 数 中 找 贡 最 大 倩 问题 。 

b. 站 扣 霸 始 丰 mm 一 1 P72 个 数 ， 当 (ta) 中 的 算法 执行 完 下 次 寻 代 后 还 剩 相 多少 个 数 ? 

es. 证 骨 ; 在 -- 台 具有 P=n 个 处 理 器 的 CRCW PRAM 上 ， 可 以 在 Oflg 器 的 运行 时 间 
村 解雇 广 迭 D 个 数 的 节 大 廿 问题 。 


绚 -3 连通 子 图 


在 这 个 问题 中 ， 我 们 米 探 讨 一 种 任意 境 CRCW 算法 ， 该 算法 选用 |V+ 到 个 处 理 嘱 计算 
出 一 个 无 回 负 扎 =(tVY，E) 的 连通 手包 。 算 法 使 用 的 数据 结构 是 -个 分 离 集合 的 藉 林 ( 见 22.3 
节 )。 等 -个 顷 点 YY V 都 有 -- 个 指针 plv| 指 向 其 人 多 二， 初始 时 ，p[v]=w 结 点 指向 其 自身 。 
在 算法 结果 时 ， 邓 任意 蝴 个 关 点 4，vC V，pfe=Pp[w 成 立 ， 当 上 仅 当 在 立 台 中 b  v。 在 
算法 执行 中 、P 指针 形成 - :个 由 有 有 和 柱 的 指针 树 组 成 的 酚 林 .。 星 是 指 这 翌 一 要 指针 树 ， 对 凤 中 
的 所 有 站 点 遇 柚 bi= pfv]. 

连通 子 几 算 法 假定 每 条 边 ( 人 0，v RE 都 出 现 丙 次: 第 一 歼 征 地利 ， 中 , 田 -- 次 是 边 (v， 
D， 算 法 使 用 了 天 种 基本 操作 ，HOOK 和 JUMP， 另 外 还 用 到 了 一 个 子 程序 STAR, 如果 
vY 属 于 --- 覃 早 ，、 斯 该 子 程序 咀 STAR[v1=TROUE。 


HRODRLIG) 
1 人 [AR 民 () 


一 -499-- 


foer 每 条 边 (0 E[Gi， 并 行 地 执行 
do 让 stsriuj and bp[u] > P[v] 
then pP[Pftuis-pP[v] 


for 二 莱 过 ko， 杂 、EfI]， 并行 地 执行 
go 让 startul and hr-p[v] 


了 
和 
4 
SS 5T 点 良 疏 5) 
在 
了 
8 then pfp[u]]<-pfv] 


JUTRWPLCGY 
1 foer 评 个 站点 Ye V[G]， 并 行 地 执行 
> do pv]* PPp[v] 


连通 子 图 算法 先 执 行 一 次 初始 的 HOOK， 然 后 反复 执行 HOQOK，jJUMP，HOO 开 ， 
JUMP， 如 此 等 等 ， 直 车 其 MP 操作 没有 修改 任何 指针 。( 注 意 ， 在 第 一 次 执行 JUMP 之 
前 ，HOOK 已 执行 过 晨 次 。) 

3a， 节 出 过 程 STARIG) 的 代码 。 

b. 证 昌 : p 个 指针 确实 形成 有 根 树 ， 树 的 根 指向 其 自身 。 并 证 明 如 果 和 v 在 同 棵 指针 
树 中 ， 则 在 邹 G 中 有 u wev。 

ec. 证 明 算 法 的 正确 性: 算法 将 会 终止 , 且 当 其 终止 时 ，p[ 吕 =Pfv] 当 百 仅 当 在 图 台中 有 
人 一 

为 了 对 连通 子 图 算法 进行 分 析 ， 让 我 们 来 考察 一 个 单 连 通 子 图 CC， 假设 C 至 少 包 含 两 
个 靖 点 。 由 定 在 算法 执行 中 的 革 … 时 旭 ，C 由 指针 树 集 合 {T 梅 成 。 我 们 定义 C 的 期 望 为 

QtC)= > heightT ) 


我 们 的 分 析 目 标 是 让 明 执 行 HOOK 和 JUMP 的 每 一 次 选 代 过 程 使 DC) 减少 一 个 常数 
图 玉 。 

d. 证 册 : 在 执行 初始 的 HOOK 后 ， 不 存在 高 度 为 属 的 指针 树 ， 并 有 中 (oj 系 |V|。 

e， 证 明 ;, 在 初 始 的 HOOK 执行 后 ， 随 后 的 HOORK 操作 不 会 使 和 (C) 的 值 增加 。 

ft 让 出 : 竺 一 个 闫 初始 的 HOOK 操作 执行 后 ， 不 存在 为 星 的 指针 树 ， 除 非 该 指针 桂 包 
含 C 中 的 所 有 站 点 。 

g, 论证: 如 果 C 还 没有 缩 为 单 架 星 ， 则 在 一 次 JUMP 操作 后 ，@(C) 的 值 至 多 是 其 先前 
苦 的 2 3。 说 明 最 二 情形 是 什么 。 

h, 证 盟 ; 猎 法 在 O(1g V) 的 运行 时 间 内 可 以 确定 G 的 所 有 连通 子 图 .. 


30-4 对 光栅 像 进行 转 秆 处理 


光栅 图 形 的 帧 缓冲 器 可 以 看 成 一 个 pxp 生 阵 M。 光 概 图 形 的 显示 硬件 使 得 位 于 M 矩 
阵 诗 让 朋 的 M 证 阵 的 nxn 子 和 卸 阵 在 用 户 屏 幕 上 可 见 。BITBLT 操作 (Block Transfer of 
BETS) 志 于 直人 给 成 的 庆 乡 从 一 个 位 置 艳 到 另 一 个 位 置 。 特 别 地 ，BITBLTIrI，ci，m，c， 
nr，me。、 站 许 

Mrc+i、c-+j]n  M[c+i，cz+j]* ML-Ai，ci+j 
i=0、1，…。、nr-1、j=0，1，…，nc-1， 其 中 * 是 具有 两 个 输 人 值 的 16 种 布尔 函数 中 的 


任 一 种 。 

我 们 所 局 兴趣 的 是 在 帧 缓冲 器 的 可 见 部 分 中 对 斤 像 进行 转 置 处 理 (0Mfi，jjP-ME， 让 。 假 
定 复 制 位 的 代价 要 低 了 于 调 者 诛 语 BITBLT 的 代价 ， 因 此 我 们 希望 尽 可 能 少 使 用 BITBLT 操 
作 ， ， 

证 明 : 用 O( 芭 由 个 BITBLT 操作 能 够 对 谭 幕 上 的 任意 图 像 进行 转 置 处 理 。 假定 pP 比 n 
大 很 和 多. 以 使 帧 缓冲 器 中 的 不 可 见 部 分 可 以 提供 是 够 的 运行 空间 。 还 希 要 多 少 额 外 的 存储 空 
问 % 提 冰 : 到 者 一 种 放行 的 “分 治 法 "， 其 中 采用 布尔 “与 "操作 来 执行 某 些 BITBLT 税 语 。} 


练习 三 十 


3 加 ,1!-1 斌 写 出 一 个 运行 时 间 为 Dllg mn) 的 EREW 算法 ， 以 确定 由 am 个 对 象 组 成 的 列表 中 的 每 个 对 象 
是 否 蚌 中 点 (第 1 n7321 个 ) 对 象 。 

30.1-2 试 写 出 一 个 运行 时 间 为 Qtg om 的 EREW 算法 ， 使 之 对 数组 x[1，…，qo 进 行 前 龟 计 算 。 不 要 
使 用 指针 ， 直 接 按 下 标 顺 序 进行 计算 。 

30.1-3 报 定 由 nn 个 对 象 组 成 的 列表 工 中 每 个 对 象 的 可 色 可 坟 是 红色 或 蓝 色 。 试 生出 一 个 有 和 妾 的 
EREW 算法 把 上 中 的 对 象 分 划 为 两 个 表 : 一 个 表 仪 出 芯 色 对 象 组 成 ， 另 一 个 圾 人 由 红色 对 象 组 成 。 

30.1-4 在 全 EREW PRAM 中 、m 个 对 象 分 布 十 数 个 不 相连 的 循环 链表 中 ， 试 号 出 一 个 有 效 算 法 ， 
为 每 个 链表 确定 一 个 侍 意 的 有 代 老 性 的 对 象 ， 并 使 链表 中 的 每 个 对 象 熊 移 识 别 出 该 代表 性 对 象 的 特征 。 候 
没 每 个 处 理 器 已 知 其 自身 的 内 一 :标本 

3 区 .1-5 试销 出 一 个 运行 时 间 为 DUg 站 的 EREW 算法 ， 该 算法 能 在 n 个 结 点 组 成 的 -及 树 中 计算 出 
以 其 中 每 全 结 点 为 很 的 子 树 的 规模 。( 提 示 : 利用 欧 拉 回路 的 运行 和 中 两 个 依 的 差异 ) 

30.1-6 绽 出 一 个 有 效 的 PREW 和 工 法 对 任意 一 尺 树 计算 出 其 先 根 ， 中 根 和 后 根 导 历 。 

30.1-7 抠 险 拉 上 路 技术 从 二 交 树 推广 到 结 点 的 摩 的 任意 值 的 有 序 笠 。 并 描述 一 种 可 以 对 其 应 用 抠 拉 
回路 技术 的 有 序 树 的 表 太 方法 。 此 外 ， 给 册 一 个 运行 时 间 为 OUe 的 EREW 算法 以 计算 出 n 个 结 点 略 成 
的 有 序 树 中 舍 个 结 点 的 深度 

区 .1-8 诚 摘 述 一 种 基于 LIST 一 RANK 的 运行 时 间 为 Dig Im 的 EREW 实现 方法 ， 要 求 明 林地 给 出 循 
环 终止 荣 件 的 测试 .( 搓 朱 : 却 测 试 训 到 循环 体内 ) 


30.2-1 假定 我 们 区 知 -- 个 一 芯 笃 织 成 的 森林 仅 包 含 一 标 由 个 结 点 梅 成 的 坠 。 证 明 在 这 一 前 提 下 ， 
用 CREW 实现 FIND-ROCTS 可 以 使 其 运行 时 间 为 OU， 与 树 的 深度 无 区 。 论 证 任何 REW 算法 都 需 
要 姨 (人 mm) 的 运行 时 间 。 

了 0.2 一 2 4 出 -一 个 大 二 FIND-ROOTS 的 EREW 算法 ， 使 其 对 中 mn 个 结 点 组 成 的 森林 运行 时 ， 和 运行 
时 间 为 Ge mh， 

了 20.23 试 妇 出 -个 技 存 贡 个 处 理 器 的 CRCW 等 法 ， 使 其 能 在 DID 的 运行 时 间 内 计算 出 nm 全 布 估 全 
的 “或 "。 

30.32-4 描述 -个 有 有 效 的 CRCW 符 法 ， 运 用 袜 个 处 理 器 计算 出 两 个 nxnm 布尔 于 阵 的 乘积 。 

30.2-5 描述 :个 有 效 的 EREW 算法 , 合 之 运用 下 个 处 理 器 计算 出 两 个 nxnm 实 永 阵 的 乘积 。 在 个 
存在 一 个 更 锐 的 普通 CRCW 算法 ?在 更 蝇 的 CRCW 模型 中 中 否 还 有 更 快 的 算法 ? 

30.2-6*+ 让 了 朋 : 对 任 意 常 数 :、 >0， 存 在 一 个 送行 时 间 为 虽 ( 生 的 CRCW 算法 ， 该 算法 运用 Don” ) 个 
处 下 器 找 出 个 匹 素 纪 成 的 数组 中 值 最 大 的 元 素 。 

30.2-7+ 说明 如 何 运 用 一 个 优先 CRCW 算法 ， 在 DID 的 运行 时 间 内 对 两 个 竹 直 nm 个 数 红 或 的 有 有 主 

数 进 行 合并 。 术 述 如 何 运 用 这 种 算法 在 和 地 的 时 间 内 进行 排 译 。 所 给 出 的 排序 算法 是 商 效 的 算法 玛 ? 

30.2-8 通过 描述 在 所 有 眉 个 处 再 器 的 EREW PRAM 上 如 何 用 QI 的 时 疗 模 拖 出 在 及 有 个 处 理 
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器 的 CRCW PRAM 上 的 并 发 该 操作 ， 来 完成 定理 30.1 的 证 明 ， 
30.2-9 说 明 在 只 有 QI 名 的 性 能 损 和 朱 的 前 提 下 ， 一 台 P 个 处 理 器 的 EREW PRAM 如 何 能 实现 一 台 
hp 个 处 理 器 的 组 合 型 CRCW PRAM 的 功能 。!( 提 示 : 运用 并 行 前 组 计算 ) 


3 如 .31 斌 证 明 与 Brent 定理 类 做 的 下 列 结 论 成 立 ; 任何 由 居 人 不 受 眼 制 的 “与 ?站 和 "或 ? 门 构成 的 布 
尔 给 合 电 路 都 可 以 由 一 个 CRCW 算法 对 其 进行 模拟 。 

30.3-2 证 明 ; 斌 以 在 一 台 EREW PRAM 上 运用 @Omny 起 可 个 处 理 器 在 口 (tg 嫩 的 运行 时 间 内 对 以 数 
诅 形 式 存 储 器 中 的 nm 值 实现 其 并 行 前 欠 计 算 。 为 什么 这 一 结果 不 能 立即 推广 到 由 个 值 组 成 的 链表 的 情形 ? 

30.3-3 涪 明 如 何 采 用 一 种 商 效 的 BREW 算法 , 以 便 在 O( LI 节 的 运行 时 间 内 计算 出 mxa 玫 阵 入 与 
维 调 旦 8 的 乘积 。 ， 

了 3-4 试 给 出 一 个 具有 他 个 处 理 器 的 CRCW 算法 以 求 出 两 个 mxam 抑 阵 的 积 。 相 对 于 运行 时 间 为 
etn ) 的 一 般 的 关于 第 阵 乘法 的 串 行 算法 来 说 ， 该 算法 应 是 高 效 的 算法 ， 能 给 出 该 问题 的 PREW 算法 吗 ? 

30.3-5 有 些 并 行 模型 允许 处 理 器 成 为 不 活动 状态 ， 这 样 执行 各 步 操 作 的 处 理 器 数目 也 就 有 所 不 同 。 
我 们 把 这 种 模型 下 的 工作 定义 为 算法 执行 过 程 中 由 活动 状态 的 处 理 央 执行 的 总 的 步 数 ， 证 明 任 何 热 行 w 工 
作 守 运行 时 间 汶 直 的 CRCW 算法 在 一 台 p 个 处 理 器 的 EREW PRAM 上 和 运行 时 ， 其 运行 时 间 为 
QUw ， p+bolg ap. ( 提 具 :最 国难 的 部 分 是 当 计算 过 程 进行 时 对 处 于 活动 状态 的 处 理 器 进行 调度 ) 


30.4-1 试 夯 图 说 明 在 RANDOMIZED-LIST-PREEFIX 中 ， 如 果 我 们 选择 表 中 两 个 相 孝 对 象 进行 猎 
除 会 产 牛 什么 错误 结果 。 

30.4-7* ” 试 对 过 程 RANDOMIZED-LIST-PREEFIX 作 一 简 单 修改 ， 使 其 对 an 个 对 象 组 成 的 表 的 运 
行 时 间 为 最 坏人 情形 下 的 运行 时 间 口中。 使 用 期 望 值 的 定 尽 来 证 明 在 对 算法 进行 这 种 履 改 后 ， 算 法 的 期 望 运 
行 上 时间 汶 品 ( 过 站 

30.4-3* ， 试 说 明 如 何 实现 过 和 枉 RANDOMIZED-LIST-PREEFIX， 人 使 得 其 在 最 坏 情 况 下 ， 每 个 处 理 
器 占用 的 存储 空间 至 多 为 ln 7/ p)， 与 递 妇 的 深度 无 关 。 

30.4_.4* 证明: 对 任意 常数 kz> 1，RANDOMIZED-LIST_PREFIX 的 运行 时 间 为 QICLE 英 的 概率 至 
少 为 1-1xnm'。 另 说 明 k 对 运行 时 间 界 中 的 这 个 常数 有 和 何 影 响 . 

30.4-5* ”运用 练习 3 了 .3-4 的 结论 ， 证 明 过 程 RANDOMIZED-LIST-PREFTX 的 期 望 运行 时 间 为 
《ML En)。 


30.s-[ 对 于 本 节 开 头 所 讨论 的 对 两 个 处 理 器 打破 对 称 人 性 的 例子 ， 说 明 其 对称 性 可 以 在 常 表 期 望 时 间 
内 被 打破 。 

30.$-? 已 知 一 个 由 nn 个 对 象 组 成 的 链表 的 乓 着 色 ， 试 说 明 在 一 台 EREW PRAM 于 ， 如 何 运用 nm 个 
处 理 器 在 DID 的 运行 时 间 内 对 该 链表 进行 3 着 色 ， 

30.$-3 假定 在 一 棵 由 n 个 结 点 组 成 的 树 中 ， 每 一 个 非 根 结 点 都 有 -- 个 指针 指向 其 父母 。 斌 写 出 一 个 
CREW 算法 以 在 OU“ 中 的 运行 时 间 内 对 树 进 行 DO) 着 色 ， 

30.5-4* ” 写 出 一 个 有 效 的 PRAM 算法 , 使 其 能 对 一 个 谋 等 于 3 的 图 进行 D(I 广 着色。 

30.5-5 个 链 表 的 KE- 支 配 集 是 一 个 链表 中 的 对 得 { 支 配 者 ) 组 成 的 集合 ， 蛙 满足: 没有 两 个 支配 者 是 相 
郎 的 . 首 昌 革 多 有 长 个 非 支 配 者 { 访 民 ) 把 支配 者 隔 开 ， 因 此 ， 一 个 MIS 是 2 支配 集 。 斌 说明 使 用 个 处 理 
器 如 何在 D(1) 的 运行 时 间 内 计算 出 由 mn 个 对 象 组 成 的 链表 的 D(1g mn) 一 支配 集 ， 并 说明 在 同样 的 假说 下 如 何 
在 口 (的 运行 时 间 内 计算 出 其 OIC 习 志 由 一 支配 集 。 

区. 和 6* 试 说 明和 如 人 柯 在 OBE ( 直 ”区 的 运行 时 间 肉 求 册 由 mn 个 对 象 组 成 的 链表 的 一 个 6 着 色 ， 作 讼 
每 个 处 至 器 能 够 存储 一 张 预先 计算 好 的 规模 为 品 ( 招 四 的 表 。( 提 示 : 在 SIX-COLOR 中 ， 一 个 对 象 的 最 终 
颜色 依赖 于 多 少 个 值 分 
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第 三 十 一 章 ”矩阵 操作 


算 阵 操作 在 科学 计算 中 非常 重要 。 因此 , 在 实际 应 用 中 关于 扼 阵 的 有 效 算 法 就 非常 值得 
我 们 注意 。 本 章 简 槛 介绍 了 邱 阵 理论 和 和 矩阵 操作 ， 着 重 介绍 矩阵 科 法 问题 与 求解 线性 方程 组 
问题 ， 

在 31.1 节 介 绍 了 和 抵 阵 的 基本 梳 仿 与 表示 方法 后 ，31.2 节 给 出 了 Strassen 算法 ， 该 算法 
能 在 Btns)= On ) 时 间 内 计算 出 两 个 nxana 和气 阵 的 积 。31.3 节 中 定义 了 氢 环 、 环 和 域 的 概 
售 ， 阐 明了 为 使 Strassen 算法 正常 运行 所 要 求 的 假设 前 提 。 该 节 中 还 讨论 了 关于 布尔 息 阵 
乘法 的 一 种 在 渐 近 意义 上 较 快 的 算法 。31.4 节 说 明 如 何 用 LUP 分 解 来 求解 线性 方程 组 . 
31.5 讨论 了 算 阵 乘法 问题 与 求 道 年 阵 问 题 之 疤 的 密切 关系 。 最 后 ，31.6 节 讨 论 了 一 类 重 
要 的 息 阵 : 对 称 正 完 垂 阵 , 并 说 明了 如 何 用 它们 来 求 出 一 个 超 定 线性 方程 组 的 最 小 二 乘 解 。 


31.1 和气 阵 的 性 质 
在 本 节 中 ， 我 们 先 复习 一 下 和 手 阵 理论 中 的 一 些 基本 概念 和 矩阵 的 一 些 基本 性 质 ， 它 们 在 
后 面 都 会 用 到 。 
短 阵 和 向 量 
矩阵 是 数字 的 一 个 矩形 阵列 。 例 如 


1 2 3 
-| | G10 
4 5 0 


是 一 个 2 x 3 矩阵 A = (ai)， 其 中 ji= 1，2, j= 1，2，3， 和 拖 阵 中 处 于 第 i 行 、 第 j 列 的 元 
未 为 ai， 我 们 用 大 写字 母 来 表示 和 抢 阵 ,用 相应 的 带 下 标的 小 写字 母 表示 矩阵 的 元 素 。 元 素 
为 实数 的 所 有 m x n 和 矩阵 组 成 的 集合 用 及 ” ”表示 。 一 般 来 说 ， 其 元 素 属 于 集合 $ 的 所 
有 m xn 矩阵 的 集合 表示 成 S” “。 


所 阵 A 的 转 喷 年 阵 A7 是 把 矩阵 A 的 行 和 列 互相 交换 而 产生 的 矩阵 ， 对 (31.10 中 的 抵 
阵 上 A， 
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1 4 


T 


A =|2 5 
人 3 6 
向 量 是 数字 的 一 维 阵列 。 例 如 : 
2 
X 一 1 3 (31 .2 
。 


是 一 个 包含 3 个 数 的 向 量 。 我 们 用 小 写字 母 来 表示 向量 。 对 i=1，2，…，n，n 维 问 量 中 
的 第 i 个 元 索 表 示 为 x 。 我 们 可 以 把 向 量 的 标准 形式 列 向 量 看 成 是 一 个 n x 1 矩阵 。 其 对 应 
的 行 向 量 可 通过 转 置 获 得 : 
x =[2 3 5]] 

单位 向 量 e 是 第 i 个 元 素 为 1， 且 所 有 其 他 元 素 均 为 0 的 向 量 。 通常 ,从 上 于 文 就 可 以 
清楚 地 看 出 单位 向 量 的 维 数 。 

零 罕 阵 是 指 所 有 元 素 都 为 0 的 抑 阵 。 这 样 的 矩阵 常常 用 0 来 表示 ， 从 上 下 文 就 可 以 把 它 
与 数字 0 区 分 开 来 。 零 矩阵 的 维 数 可 以 从 上 下 文 得 出 。 

我 们 经 常会 遇 到 n x n 方 阵 。 方 阵 的 用 种 特殊 情形 非常 值得 我 们 重视 。 

1. 对 角 和 矩阵 : 每 当 i 关 j， 有 ai 一 0。 因 为 所 有 的 非 对 角 线 上 的 元 素 均 为 0， 所 以 可 以 通 
过 列 出 对 角 线 上 的 元 素 表 示 对 角 算 阵 : 


ai 0 必 
0 ay， 0 
diag(a  ，a，，…，a) 一 ， 
0 0 纪 
2.n X n 单 位 和 矩阵 I 是 对 角 线 上 的 元 素 都 是 1 的 对 角 和 矩阵 : 
L =diag(1，1，…，] 
] 0 
01…0 
0 人 0 … 1 


当 工 不 带 下 标 时 ， 它 的 规模 可 以 从 上 下 文 推出 。 单 位 矩阵 的 第 i 列 就 是 单位 向 量 ei。 

3. 二 对 角 定 阵 了 是 满足 若 下 一 计 > 1， 则 元 素 ti = 0 的 矩阵 。 非 零 元 素 仅 出 现在 主 对 角 
线 上 ， 紧 这 主 对 角 线 上 面 (t，，i= 1，2，…，n 一 和 紧 靠 对 角 线 下 面 (t 
=1，2，…， 一 ]: 


| 
十 15 


一 
中 
心 ) 
已 
局 
心 
党 


Et 二 2 了 革 23 心 恬 了 必 
0 tt ta 人 0 0 

了 = : : : : 
0 000 ”tt ， 0 
00 0 0 … t _,。， tt 
000 0 … 0 t， _， t 

4. 上 三 角 丁 阵 U 是 满足 : 若 1i>j， 则 ui =0 的 和 矩阵。 对 角 线 下 面 的 所 有 元 素 均 为 小 

Ui， ai， Di 

U- 0 u， uU 
心 昌 全 


如 果 其 对 角 线 元 素 都 是 1， 则 这 样 的 上 三 角 年 阵 称 为 单位 上 三 角 符 阵 。 
5- 下 三 角 和 矩阵 工 是 满足 : 若 i<j， 则 1 =0 的 矩阵 。 对 角 线 上 面 的 所 有 元 素 均 为 和 
1 0 … 0 


] ] 1 1 
如 果 其 对 角 线 元 素 都 是 1， 则 这 样 的 下 三 角 矩阵 称 为 单位 下 三 角 答 阵 . 
6. 排列 矩阵 P 的 每 一 行 或 列 中 都 仅 含 一 个 1， 其 他 元 素 帮 为 0。 下 列 矩 阵 是 排列 矩阵 的 
一 个 例子 
有 


芝 一 呈 己 
一 二 总 扎 


党 二 
乙己 


0 0 0 0 
这 个 和 矩阵 之 所 以 叫 微 排列 答 阵 , 是 因为 把 一 个 向 量 x 与 一 个 排列 矩阵 相 乘 所 得 结 乐 坏 
是 向 量 x 中 的 元 素 的 一 种 排列 。 


7. 对 称 矩 阵 4 满 足 条 件 A = A 。 例 如 : 
1 2 3 


26 4 
34 35 
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就 是 一 个 对 称 秆 阵 。 


关于 矩阵 的 探 作 


皇 阵 或 向 量 中 的 元 来 源 于 一 个 数字 系统 ， 例 如 实数 、 复 数 或 整数 对 某 质数 取 模 所 形成 
的 数字 系统 .数字 系统 中 对 数 的 加 法 和 屁 法 都 作 了 定 尽 ， 我 们 可 以 把 这 些 定义 推广 到 矩阵 的 
加 法 与 乘法 运算 中 。 
定义 定 阵 加 法 如 下 ， 如 果 A=(ai)，B=(b 是 mxa 和 上 矩阵， 出 它们 的 和 扼 阵 和 
C=(ci)=A+B 是 mxn 垂 阵 ， 满 足 ， 
ci 一 aibi 
ij= 1I，2，…，m，j=1，2，…，n。 亦 即 , 矩阵 加 法 是 通过 对 各 怎 阵 的 对 应 元 素 分 别 相 如 所 
获得 的 ， 等 惩 阵 是 矩阵 加 法 运算 的 单位 元 : 
AA0O= 入 
= 0+A 
如 果 4 是 一 个 常数 ，A= (ij 是 一 个 扼 阵 ， 则 和 矩阵 A 的 标量 滋 4AA=(4ai) 是 用 1 乘 以 入 
中 各 元 素 形成 的 答 阵 。 作 为 一 个 特例 ， 定 义 邱 阵 A= (ai) 的 负 和 矩阵 为 ~1 . A= 一 A, 一 A 的 第 jj 
个 元 素 为 -aij， 因 此 有 
和 十 (一生 ) 一 人 
一 (一 A) 十 AA 
有 了 上 述 定 文 后 ， 就 可 以 把 两 个 矩阵 的 差 定 义 为 一 个 矩阵 与 另 一 个 和 拭 阵 的 负 乞 阵 的 和 : 
A--B=A+(--B) 
定义 矩阵 的 乘积 如 下 。 首 先 , 两 个 可 以 相 乘 的 矩阵 A 和 B 必须 是 相 容 的 ， 即 A 的 列 数 
必须 等 末 B 的 行 数 。(-- 般 地 ， 在 一 个 包含 矩阵 积 AB 的 表达 式 中 ， 通 党 已 隆 含 地 假设 矩阵 
A 和 和 抢 阵 目 是 相 窜 的 。) 胡 果 A= (aij) 是 一 个 和 xn 矩阵 ，B= (bg 是 一 个 mxp 和 矩阵， 则 它们 
的 乘积 C= AB 是 mxp 短 阵 C=(cx)， 其 中 
ci， 二 aibn (31.3) 
i 一 1、2，…，Im，Kk 一 1，2，…，n。26.1 节 中 的 过 程 MATRIX-~-MULTIPLY 就 是 用 
基于 (31.3) 的 简单 方法 来 实现 矩阵 乘法 的 ， 它 假定 所 有 和 抢 阵 都 是 方 阵 ， 即 中 =a=Pp。 为 了 求 
出 两 个 nxn 方 阵 的 乘积 ， 过 程 MATRIX-MULTIPLY 执行 中 次 滋 法 和 nzn 一 1 次 加 法 ， 
它 的 运行 时 间 为 Btn )。 
矩阵 的 许多 (但 不 是 全 部 ) 代 数 性 质 与 数字 的 相同 。 单 位 竹 阵 是 矩阵 乘法 的 单位 元 : 
了 A 一 AL = 入 
其 中 A 为 任意 mxn 和 矩阵。 任何 一 个 矩阵 与 零 年 阵 的 积 就 是 零 所 阵 : 
A0= 昌 
矩阵 乘法 满足 结合 律 ， 芭 对 相 容 的 和 阵 A，B，C， 有 
ABC 一 (ABIC (31.4) 
宇 阵 乘法 对 加 法 满足 分 配 律 ， 
AtB+C)=AB+AAC 
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{ 了 -二 CIDHBD 十 【1 .9 
但 是 ,nm x 2 类 陈 梯 法 及 满足 交换 律 ， 除非 n = 1 


0 1 如 0 1 收 心间 
妨 0 ] N0 0 0 旭 1 


定义 矩阵 与 向 量 的 匀 积 或 向 量 与 向 量 的 妇 积 如 下 : 我 们 可 以 把 向 量 看 作 n x 1 矩阵 (或 
把 行 向 量 看 作 1 xm 抑 阵 )， 因 此 ， 如 果 A 是 一 个 mm xn 矩阵 ，x 是 一 个 呈 维 向 量 ， 则 Ax 
是 一 个 mn 维 向 量 。 如 果 x 和 y 都 是 n 维 向 量 ， 则 

xry 一 xy 
是 -- 个 数 (实际 上 是 一 个 由 矩阵 )， 称 为 x 和 y 的 内 积 ，xy"” 是 一 个 n xn 的 矩阵 Z， 称 
为 xx 和 Yy 的 外 积 ， 其 中 z， =Xiyj。a 维 回 量 x 的 ( 欧 氏 ) 范 数 由 下 式 定义 ， 


lx = (xy 十 xz 十 ， 0 


一 (x 了 


欧 氏 范 数 儿 xl 是 向 量 x 在 n 维 欧 氏 空间 中 的 长 度 。 
逆 答 阵 ， 秩 和 行列 式 
定义 nx 如 矩阵 A 的 道 矩 阵 A-” 为 满足 AA- =A&-A=L 的 一 个 naxan 和 矩阵 。 例 如 : 


1 1 ro li 
| -|， 国 
很 雪 非 和 mn xn 和 矩阵 没有 逆 和 矩阵 ， 没有 道 矩 阵 的 抢 阵 称 为 不 可 道 矩 阵 或 奇 妈 和 矩阵 。 下 
面 的 矩阵 就 是 一 个 奇异 矩阵 ， 
1 0 
[| 
如 果 一 个 矩阵 有 道 矩 阵 ， 则 称 为 可 求 道 矩 阵 或 非 奇 异 些 阵 ， 如 果 手 阵 的 道 扎 阵 存在 ， 则 
必定 是 唯一 的 (由 练 习 31.1-4)。 如 果 A 和 下 是非 坷 异 的 xn 和 矩阵 ， 则 : 
(BA 六 一 AIB” (31.6) 
求 逆 运 算 与 转车 运算 满足 交换 律 ; 
(A 一 (AI 
设 x，x，…，x 为 mn 个 向 量 ， 若 存在 不 全 为 堆 的 常 系数 cl，c，…，c， 见 至 少 有 一 
个 c= 拓 0， 使 
CIXITC2X2 十 … 十 Cox 一 站 
成 立 ， 就 称 xl，z，…，z 为 线性 相关 ， 否 则 称 之 为 线性 独立 例如 ， 向 量 x 一 (1，2， 
3 ，x=( 人 2，4，9 和 好 =(4，11，9% 是 线性 相关 的 ， 因 为 2xi+3x 一 2x =0。 单 位 和 矩阵 中 
的 各 询问 量 为 线性 狐 立 。 
非 零 mxna 和 矩阵 和 的 列 秩 是 指 和 的 列 向 量 中 线性 独立 子 系 的 向 量 最 大 个 数 . 类 似 地 ， 


A 的 行 秩 是 指 A 的 行 向 量 中 线性 独立 子 系 的 向 量 最 大 个 数 。 任 何 和 矩阵 A 的 一 个 最 基本 的 性 
项 就 是 其 行 秩 与 列 秩 总 是 相等 ， 因 此 我 们 可 以 简单 地 说 A 的 秩 就 可 以 了 。 如 xm 矩阵 的 秩 是 
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0 和 mintm，m 之 间 的 一 个 整数 .委托 阵 的 秩 为 0，Dnxa 单位 窍 阵 的 秩 为 aa。) 通 常 我 们 还 
有 一 种 更 右 玫 的 关于 定 阵 的 秩 的 等 价 定义 。 非 零 mxn 和 矩阵 A 的 秩 是 满足 :存在 中 xr 算 阵 
B 和 rrxnm 短 阵 C 且 有 A= BC 成立 的 最 小 的 数 fr。 如 果 mxmn 方 阵 的 秩 为 nm， 则 它 是 一 个 满 
秩 和 矩阵 。 上 列 定 理 指 册 了 秩 的 一 个 基本 性 质 . 

定理 31.1 -- 个 方 阵 满 特 的 充 要 条 件 是 它 为 非 奇异 方 阵 。 

如 果 一 个 mxf 矩阵 的 秩 为 mn， 则 称 之 为 列 满 秩 的 和 矩阵 。 

所 阵 A 的 空 疝 量 是 指 注 足 Ax= 人 0 的 一 个 非 零 向 量 x。 下 列 定理 与 其 推论 找 出 了 列 秩 和 
奇异 性 的 概念 与 空间 量 之 间 的 联系 、 证 明 过 程 留 作 练习 31.1 一 8. 

定理 31.2 秆 阵 A 为 列 满 秩 当 且 仅 当 和 撼 阵 无 空 向 量 . 

推论 31.3 方 阵 AAA 为 奇异 方 阵 当 且 仅 当 A 具有 空间 量 。 

对 ga>t1， nxona 苍 阵 A 的 第 直子 式 是 把 A 的 第 i 行 和 第 j 列 的 元 素 去 掉 后 所 形成 的 一 个 
fn- 虽 x (n 一 1 算 阵 AD。nxn 托 阵 A 的 行列 式 可 用 其 子 式 递 归 定 义 如 下 : 


3 11 
人 ef 代 册 ) 一 


adetA) 一 adet(Al 十 人 二 《一 D” al Get(A 若 m>1 


其 中 项 (一 det(A ) 称 为 元 素 a, 的 代数 全 子 式 ， 


向 ] 
下 列 定 理 说 明了 了 行列 式 的 : _ 个 基本 性 质 ， 其 证 明 从 略 。 
定理 31.4( 行 列 式 的 性 质 ] ” 方 阵 A 的 行列 式 有 如 下 性 质 : 
”如果 和 的 任何 行 或 列 的 元 素 为 0， 则 det(A) 一 0。 
` 用 常数 4 好 六 的 行列 式 任 意 一 列 (或 任意 一 行 ) 的 诸 元 素 ， 等 于 用 1 乘 和 的 行列 式 。 
上 的 行列 式 中 一 列 ( 或 一 行 } 无 素 如 上 另 一 列 ( 或 男 一 行 ) 中 的 相应 元 素 ， 行 列 值 的 值 不 
- 有 的 行列 式 的 值 与 其 转 置 矩阵 A ”的 行列 式 的 值 相 等 。 
-行列 式 的 任意 两 剂 (或 两 行 ) 互 换 ， 则 其 值 改 号 。 
另外 、 对 任意 方 阵 上 和 B， 我 们 有 det(AB)=det(Akiet(B) 
定理 31.5 nxn 方 阵 A 是 坷 异 方 阵 ， 当 且 仅 当 det(A)= 0.。 


正定 矩 碟 


正定 年 阵 有 许多 重要 应 用 。 对 于 一 个 mxan 和 矩阵 A， 如 果 对 所 胖 维 向 量 xl0 都 有 
xTAx>0， 则 称 矩 阵 A 为 正定 矩阵 。 例 如 ， 单 位 抢 阵 是 正定 矩阵 ， 因 为 对 任何 非 零 向 量 
X 一 (Ki ，Xy。，…， 其 四 ， 
X 工 入 一 其 基 
= 民用 
-了 
全 心 
我 们 将 要 看 到 ， 由 于 有 下 列 定理 成 立 ， 实 际 应 用 中 轴 到 的 抢 阵 常常 是 正定 矩阵 。 
定理 31.6 ”对 任意 列 满 秩 失 阵 A， 和 矩阵 A A 是 正定 矩阵 。 


(31.7) 


证 明 : 我 们 必须 证 明 对 任意 非 零 向 量 x 都 有 x (A Alx >0 蕊 立 。 对 任意 向 量 x， 
x (A Ai 一 (AN (Ax (根据 练习 31.1 -- 3) 
一 外 Ax 有 上 
基站 {31.8) 
注意 ，1Ax 人 容 好 是 向 量 Ax 中 各 元 素 的 平方 和 。 因 此 ， 如 果 HAx 导 =0， 则 Ax 的 每 
个 元 素 都 是 0， 即 Ax = 0。 耻 于 A 是 一 个 列 满 秩 皇 阵 ，Ax =0 就 克 含 x=0。 因 此 ， 由 定 
理 31.2 可 知 ，A A 是 正定 抢 阵 。 
我 们 将 在 第 31.6 节 中 讨论 正定 和 矩阵 的 其 他 一 些 性 质 。 


31.2 ”关于 和 矩阵 乘法 的 Strassen 算法 


本 节 要 讨论 求 两 个 axna 和 矩阵 乘积 的 鞭 名 的 Strassen 递归 算法 ， 其 运行 时 间 为 
Btnljg ) 一 名 fn)。 对 中 各 大 的 nm， 该 算法 在 性 能 上 超过 了 我 们 在 26.1 节 中 介绍 的 运行 时 间 
为 旨 (o 的 简易 矩阵 乘法 算法 MATRIX-MULTIPLY- : 


算法 概述 


Strassen 算法 可 以 看 成 是 我 们 熟知 的 一 种 设计 技 瑟 一 一 分 治 法 一 一 的 应 用 。 息 设 我 们 和 关 
望 计 算 磁 积 如 =AB， 其 中 凡 ， 了 和 妆 都 是 mxn 方 阵 。 假 定 mn 是 2 的 宕 ， 我 们 把 A，B 和 
C 都 划分 为 四 个 ny72xny2 逢 阵 。 等 式 C=AB 可 改写 如 下 : 


| | | | | | 

一 (31.9) 
t 1 习习 f 让 
(练习 31.2-2 处 理 了 m 不 是 2 的 寡 的 情形 。) 为 了 方便 起 见 ， 对 AAA 的 子 矩 阵 从 左 到 右 进 行 标 
号 ， 对 了 蕊 的 子 矩 阵 从 上 到 下 进行 标号 ， 以 与 矩阵 乘法 的 执行 方式 保持 一 致 。 因 此 ， 等 式 


{31.9) 对 诬 于 以 下 四 个 等 式 : 
F 一 ae 二 H 了 (31.10) 
s = agt+bh (31.11) 
t 一 CeHdf {31.12) 
uU 一 CE+dh (31.13) 


上 面 每 个 等 式 都 包含 了 两 次 na72xn72 和 矩阵 的 乘法 运算 和 两 次 乘积 所 得 nZ2xny2 
矩阵 的 加 法 和 运算。 如果 用 这 些 等 式 来 证 明 一 个 简单 的 分 治 策略 ， 我 们 可 以 推出 下 列 关 于 两 个 
xm 矩阵 相 乘 所 需 时 间 TIn) 的 递归 式 : 

Tm= Tony 2HB(o3 {31.14) 

不 幸 的 是 ， 递 归 式 (31.14) 的 解 为 TD=Gno)， 因 此 这 种 方法 并 不 比 普通 的 方法 执行 速 
度 快 . 

Strassen 发 现 了 娘 外 一 种 不 同 的 递归 方法 ， 该 方法 只 需要 执行 了 次 递归 的 ny2xnyv 2 
的 矩阵 匀 法 运算 和 名 (中 次 标量 加 法 与 藏 法 运算 ， 从 而 得 到 递归 式 : 

TI 一 7TIO7 2HG(nD9) (31.153) 
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一 候 (nE ) 
一 Onzs0 
Strassen 方法 分 为 以 下 四 个 步 楼 ， 
1. 如 等 式 (31.9) 那 样 ， 把 输入 矩阵 A 和 了 划分 为 ny/2xhy2 的 子 矩 阵 。 
2. 运 用 @(o5) 次 标量 加 法 与 减法 运算 ， 计 算出 14 个 nan/2xnv2 的 答 阵 A，B，A，， 
B,，…，AJ，B,。 
3. 递 归 地 计算 出 了 个 和 宅 阵 积 Pi,=A;Bi，i 一 1，2，…，7 了 。 
4. 使 用 @(o5 次 标量 加 法 和 减法， 对 Pi 矩阵 的 各 种 组 合 进行 求 和 或 求 差 运 算 ， 从 而 获得 
姑 果 和 定 阵 CE 的 四 个 子 息 阵 T，8， t， 了 。 
上 述 过 程 满足 递归 式 (31.13)， 现在 我 们 所 需要 做 的 就 是 对 上 述 步骤 进行 细 化 . 


确定 子 答 阵 的 雄 积 


现在 我 们 还 不 清楚 Strassen 当时 是 如 何 找 出 算法 正常 运行 的 关键 一 子 矩 阵 积 的 。 在 
此 ， 我 们 重新 构造 一 种 似乎 可 能 的 发 现 方 法 。 

我 们 猿 想 每 个 矩阵 的 积 P, 可 以 写成 如 下 形式 : 

=(xa+eob 二 cc+o 中 e+pf+pEg+TRpDb) (31.16) 

其 中 系数 ， 有 都 属于 集合 {-1，0，1}。 就 是 说 ， 我 们 猜想 :对 抢 阵 A 的 某 些 子 和 矩阵 进行 
埠 减 运算 ， 并 对 矩阵 B 的 某 些 子 矩 阵 进 行 加 减 运算 ， 再 把 所 得 的 结果 相 乘 ， 从 而 计算 出 每 
个 子 矩 阵 积 。 当 然 还 有 一 些 策略 也 是 可 行 的 ， 但 这 种 简单 策略 已 被 证 明 是 行 之 有 效 的 。 

如 果 用 这 种 方法 得 到 我 们 要 求 的 积 ， 则 可 以 继续 递归 地 运用 这 种 方法 而 无 需 假 定 乘法 满 
足 交 换 律 ， 这 是 由 于 在 每 个 积 中 A 的 所 有 子 算 阵 都 在 其 左面 ， 而 B 的 所 有 子 矩 阵 都 在 右 
边 。 这 种 性 质 对 能 够 递归 地 运用 这 种 方法 来 说 是 很 关键 的 ， 因 为 矩阵 乘法 不 满足 交换 律 。 

为 了 方便 起 见 ， 我 们 将 用 4x4 气 阵 来 表示 子 矩 阵 舱 的 线性 组 合 ， 其 中 每 个 积 如 等 式 
(31.16) 中 那样 把 A 的 一 个 子 矩 阵 与 B 的 一 个 子 矩阵 进行 组 合 。 例 如 ， 我 们 可 以 把 等 式 


(31.10 改 写 为 ， 
[一 汉人 十 二 
十 10 00 作 
六 十 100 上 
=[abecdl| 
妖 属 疾 0 宪 
人 心 站 必 h 


上 面 最 后 的 表达 式 使 用 了 一 种 简略 记 法 ,其 中 “二 ”表示 +1“. ”表示 0“--” 表 
示 一 攻 从 此 以 后 ， 我 们 省 略 行 和 列 的 标号 }。 如 果 使 用 这 种 记 法 ， 我 们 就 有 如 下 结果 算 
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阵 C 的 其 他 子 和 矩阵 ， 


十 
十 
s 一 3 名 十 bb 一 
t=ece 十 二 一 
十 
十 
一 CE 十 昌 h 王 
十 
十 


现在 我 们 开始 寻找 一 种 有 关上 矩阵 乘法 的 快速 算法 。 通 过 观察 ， 我 们 发 现 子 扎 阵 s 可 以 
由 式 s 三 P, + 了 P, 计算 ， 其 中 分 别 使 用 一 次 矩阵 乘法 就 可 以 计算 出 P， 和 了 P,。 
十 - 


PP = 上 A,BI 一 a 人 一 名 =ag 一 ah 一 


P,=A,B,=(a+bl.h=ah+bh 一 


矩 噬 { 可 以 用 类 似 的 方式 t= P, + 了 P, 求 得 ,其 中 


PP 一 A;B, 一 4 十 山 'e=ce 二 de= 


了 ,一 A,B 一 dd 企 一 避 =df 一 de= 


定义 基本 项 为 出 现 于 等 式 (31.10) - (31.13) 右 端的 八 项 中 的 一 项 。 我 们 现在 已 使 用 了 四 
个 积 来 计算 两 个 基本 项 为 ag，bh，ce 和 df 的 子 矩 阵 s 和 t。 注 意 ，P 计算 基本 项 ag，P 


3 
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计算 基本 项 bh，P, 计算 基本 项 ce，P, 计算 基本 项 df。 因此， 现在 所 需要 做 的 就 是 使 用 另 
外 不 多 于 3 个 的 积 计 算出 剩余 的 两 个 子 矩阵 和 u， 其 基本 项 为 对 角 项 ae，bf，cg，dh。 为 
了 一 次 计算 出 两 个 基本 项 ， 现 在 用 新 方法 计算 P,: 

十 - :十 


P,=A,B,=(a+d:(e+hb=ae+ah+de+dh= 


+ `、 ”+ 
除了 计算 出 基本 项 ae 和 dh 外 ，P, 还 计算 出 非 基 本 项 ah 和 de，、 从 某 种 程 谍 上 说 这 两 
项 是 不 常 需要 的 。 我 们 可 以 使 用 P, 和 P, 来 消去 它们 、 但 是 又 会 产生 另外 两 个 非 基 本 项 : 
十 


P. +P, 一 P,=ae+dh+d 灶 一 bh~~ 
通过 加 人 另外 一 个 积 : 
P, =A,B.=(b- 由 :G+H 一 bft+bh 一 df 一 由 一 
伍 征 .我 们 得 到 : 
r 一 P.+P, 一 P.+P, =ae+bf=- 


我 们 可 以 采用 类 似 方法 ， 通 过 运用 P， 和 了 , 把 P, 的 非 基本 项 移 到 不 同 的 方向 来 从 了 
得 到 了 U: 
十 "。 十 


了 .十 王 | 一 了 ;一 ae 十 ag 一 ce 十 dh 王 


通过 减 去 另外 -- 个 积 


P; 一 和,B; 一 地 一 可 te 十 划一 ae 十 8 一 ce 一 恪 一 
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可 以 得 到 


一 上 了. 十 下 ， 一 了 ,一 卫 , 一 cg 十 Gh 一 


十 
十 . 
这 样 ，7 了 个 子 抵 阵 P,，P,，…， 了 ,就 可 以 用 于 计算 积 C= AB， 我 们 至 此 完成 了 
对 Strassen 方法 的 论述 。 
讨论 


Strassen 算法 的 运行 时 间 中 隐 售 的 较 大 的 帝 数 使 其 只 有 在 矩阵 足够 太 冲 至 少 为 43) 并且 
足 辟 稠密 (几乎 没有 零 元 素 ) 时 才 比 较 实 用 。 对 于 规模 小 的 矩阵 ， 通 常 选 择 葡 述 的 简单 算法 ， 
对 于 大 的 稀 朴 定 阵 ， 我 们 有 性 能 超过 Strassen 算法 的 实用 的 稀 朴 矩阵 算法 。 因 此 ，Strassen 
方法 仅 在 理论 上 值得 我 们 重 视 。 

通过 使 用 一 些 本 书 没有 涉及 的 先进 技术 ， 实 际 上 我 们 可 以 获得 运行 时 间 优 于 Gtne) 的 
矩阵 磁 法 算法 。 目 前 , 运行 时 间 的 最 理想 上 界 钓 为 Dln)。 最 好 的 下 界 显然 就 是 Qn2( 说 
显然 是 因为 我 们 必须 在 答 阵 积 中 项 满 m 个 元 素 )。 因 此 ， 目 前 我 们 还 不 知道 矩阵 乘 法 究竟 有 
多 困难 。 

Strassen 算法 并 没有 鉴 求 息 阵 的 元 素 为 实数 。 重 要 的 是 数字 系统 能 形成 一 个 代数 环 。 但 
是 ， 奶 果 目 许 的 元 素 不 能 形成 一 个 环 ， 有 了 时 就 应 用 其 他 技术 使 这 一 方法 得 以 实 更。 这些 问题 
将 在 下 一 节 中 更 详细 地 讨论 。 


*31.3 代数 系统 与 布尔 矩阵 乘法 


算 阵 加 法 .了 汪 法 的 性 质 依赖 于 作为 其 基础 的 数字 系统 。 在 本 节 中 ， 我 们 要 讨论 三 种 不 同 
的 数字 系统 : 拟 环 、 环 和 域 。 我 们 可 坎 在 拟 环 上 定义 矩阵 乘法 ，Strassen 算法 就 是 一 种 基于 
环 上 的 矩阵 乘法 算法 ， 然 后 ， 我 们 论述 一 种 把 定义 在 拟 环 上 的 布尔 矩阵 乘法 转化 为 定义 在 环 
上 的 皇 阵 乘法 的 实现 技 万 。 最 后 ， 我 们 要 讨论 为 什么 不 能 合乎 自然 地 利用 域 的 性 质 ， 以 得 出 
关于 算 阵 乘法 的 更 好 的 算法 。 


拟 环 


设 ($， 电 ，@，0.1) 表示 一 个 数字 系统 ， 其 中 8$ 是 一 个 集合 ， 外 和 国 是 定义 在 S 上 
的 一 元 运算 符 (分别 代表 加 靶 与 乘法 运算 )，0 和 1 是 S 中 两 个 不 同 的 元 素 。 满 足下 列 性 质 的 
系统 就 是 一 个 氢 环 。 
1.(S$， 由 ，0) 是 一 个 类 群 
: S 对 四 是 封闭 的 ， 即 对 所 有 a，beS， 有 a@ beS 
- 纯 满 足 结 合 律 ， 即 对 所 有 a，b，ceS， 有 a 申 由 由 日 = (a 由 昌 甲 c 
0 是 四 的 单位 元 ， 即 对 所 有 aeS$， 有 a 中 0=0 中 a=a 

同样 ，(S， 喇 ，1) 也 是 一 个 类 群 。 
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2. 0 是 零 元 素 ， 即 对 所 有 aeS， 有 ae0 = 0ea 一 0 

3. 运算 母 满足 交换 律 ， 即 对 所 有 a，beES， 有 a 中 b=b 虫 a 

4， 运算 直 对 旨 满 足 分 配 律 ， 邑 对 所 有 a，b，ceS$， 有 ab 申 口 = (ab) 中 (ecG)a) 
和 (人 b 申 ckea = (ba) 中 (ce)a)。 

类 似 环 的 实例 很 和 多， 包括 布尔 拟 环 ({0，1， 和 人 ，w，0，1)， 其 中 Y 表示 届 辑 “或 ” 
运算 、 信 表示 还 辑 “ 与 ”运算 。 述 有 自然 系数 (N， 二 ， : ，0，D， 其 中 + 和 分 员 表 
示 普 通 的 如 法 和 乘法 运算 ， 任 何 闭 半 环 都 是 拟 环 ( 抑 26.4 节 )。 此 外 ， 闭 半 环 还 不 满足 知 等 
性 以 及 无 限 求 和 的 性 质 。 

我 们 可 以 像 31.1 节 中 对 待 外 和 凶 那样 把 + 和 扩展 到 算 阵 运算 。 如 果 我 们 用 I 表 


示 由 0 和 1 组 成 的 n xn 单 位 系 阵 ， 我 们 就 会 发 现 矩 阵 嫌 法 具有 完备 的 定义 ， 并 且 正 如 下 烈 
定理 所 述 ， 和 矩阵 系统 本 身 就 是 一 个 拟 环 。 
定理 31.7( 拟 环 土 定义 的 扰 阵 构成 一 个 氢 环 ) 


如 果 (S， 申 ， 四 ，0.1) 是 一 个 拟 环 且 mn > 1， 则 人” ， 鲜 ， 轩 ，5， 工 ) 是 一 个 拟 环 。 

证 明 :, 证 明 过 程 留 作 练 习 31.3 一 3。 

环 

对 拟 环 没有 定义 减法 运算 ， 但 对 于 一 个 同时 也 是 氢 环 的 环 (S$， 申 ， 加 ，0,1) 来 说 ， 还 
有 下 列 性 质 成 立 : 

$. S$ 中 的 每 个 元 素 都 有 一 个 加 法 的 道 元 素 ， 即 对 所 有 asS， 存 在 一 个 元 素 bsSs 满足 
3 中 b=b 四 aa=0， 这 样 的 元 素 bb 也 称 为 a 的 负 元 素 ， 表 示 为 (一 引 。 

在 定 浆 了 所 有 死 素 的 负 雹 素 的 条 件 下 ， 我 们 就 可 以 对 减法 运算 定 尽 为 aa 一 bb 一 a 十 【 
-bl ， 

关于 环 的 合子 有 很 和 多。 在 通常 如 法 与 磁 法 运算 下 的 整数 (人 Z，+ ， :- ，0，1) 形成 一 个 
环 ， 对 任意 整数 n> 1， 整 数 模 nm 所 得 的 整数 一 即 ( 人 (CC ， 十 ，-，0，1)， 其 中 + 是 指 
加 法 模 n 和 运算， 指 乘 法 模 n 运算 一 一 也 形成 一 个 环 。 环 的 另 一 个 实例 是 在 道 常 的 运算 下 
的 x 的 实 系数 有 限 次 多 项 式 集 合 RD 一 一 即 (RIxl，++， ':，0，1)， 其 中 + 是 指 多 项 式 的 
加 法 ，， 是 指 多 项 式 乘法 。 

下 列 推论 说 明 可 以 把 定理 31.7 自 环 推 广 到 环 的 情形 。 

推论 31.8( 定 义 环 上 的 矩阵 形成 一 个 环 ) ”如果 (S， 申 ， 四 ，0,H 是 一 个 环 并 且 Dn 1， 

则 (S”“， 申 ， 轩 ，0， 工 ) 也 是 一 个 环 。 

证 明 : 证 明 过 程 留 作 练习 ( 见 练习 31.3 一 习 。 

迹 用 上 述 推论 ， 我 们 能 够 证 明 下 列 定 理 。 

定理 31.9 Strassen 第 阵 乘 法 算法 对 任何 元 素 为 矩阵 的 环 都 能 正确 执行 。 

证 骨 : Strassen 算法 的 正确 性 取决 于 对 2x2 和 矩阵 的 算法 是 否 让 确 ， 而 这 一 算法 的 正确 
性 仅 要 求 算 阵 元 素 属 于 一 个 环 , 而 因为 矩阵 元 素 的 确 属于 一 个 环 ， 所 以 推论 31.8 说 明和 矩阵 本 
身 也 形成 一 个 环 。 因 此 ， 由 此 可 推 知 ，S$Strassen 算法 在 每 层 递 时 过 程 中 都 能 正确 执行 。 

事实 上 ， 关 于 矩阵 乘法 的 Strassen 算法 非常 依赖 于 道 元 素 的 存在 。 在 七 个 积 中 ， 有 四 
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个 都 涉及 子 抵 阵 的 差 。 因 此 ，Strassen 算法 在 一 般 的 类 环 上 不 能 运行 。 
布尔 矩阵 的 生 法 


Strassen 算法 不 能 直接 用 于 布尔 矩阵 的 蒋 法 ， 这 是 因为 (10，1}1， 六 ，w，0，1) 是 一 个 
氢 环 ， 而 不 是 一 个 环 。 有 时 一 个 氢 环卫 能 包含 在 一 个 更 大 的 环 中 。 例 如 ， 自 然 数 ( 它 是 一 
拟 环 ) 是 整数 ( 它 是 一 个 环 ) 的 一 个 子 集 ， 因 此 如 果 我 们 把 作为 基础 的 数字 系统 看 成 整数 ， 
Strassen 算法 就 可 以 用 于 关于 自然 数 的 矩阵 乘法 。 不 幸 的 是 ， 疫 有 一 种 类 似 的 方法 能 把 布尔 
拟 环 扩 纤 到 一 个 环 . 〈《 见 练习 31.3- 作 

二 列 定 理 说 明了 把 布尔 矩阵 乘法 转化 为 一 个 环 上 的 乘法 的 一 种 简单 技巧 。 问 题 31--1 中 
阐述 了 另外 一 种 有 效 方 法 。 

定理 31.10 如果 Mo 表示 两 个 定义 整数 上 上 的 nxnmn 矩阵 相 乘 需要 执行 的 算术 运算 的 次 
数 ， 则 使 用 O(M(nJy) 算 术 运 算 就 可 以 求 出 两 个 axa 布尔 矩阵 的 匀 积 。 

证 明 : 设 两 个 符 阵 为 A 和 B， 并 且 C= 一 AB 属于 布尔 类 环 ， 即 

cj 一 Va Ab 


下 下 


我 们 不 在 布尔 尘 环 上 进行 计算 ， 而 是 用 给 定 的 使 用 Mtn) 次 算术 操作 的 矩阵 乘法 算法 在 
整数 环 上 计算 积 C"。 画 此 我 们 有 


ci 一 Z ai 
其 中 每 个 项 ab 为 0 当 且 仅 当 au 人 bj =0, 每 个 项 ab 为 1 当 且 仅 当 ak 人 b, = 1。 因 
此 ， 束 数 和 以， 等 于 0 当 且 仅 当 每 个 项 为 0, 或 者 等 价 地 说 ， 当 目 仅 当 所 有 项 的 布尔 “或 ， 
即 c, 为 0。 这样， 只 要 通过 把 每 个 cj 与 0 进行 比较 ， 我 们 就 能 够 使 用 @(n”) 次 算术 运算 
从 整数 矩阵 C 重新 构造 出 布尔 矩阵 C， 所 以 整个 过 程 所 需要 的 算术 运算 次 数 为 OUM(n)) 
+ en )= O(Mn)( 这 是 由 于 Ma) = Q(n7)). 

因此 , 运用 Strassen 算法 ， 我 们 就 能 够 在 O(n” ) 的 运行 时 间 内 执行 布尔 矩阵 乘法 。 

在 布尔 矩阵 乘积 的 正规 方法 中 仅 使 用 了 布尔 变量 。 但 是 ,. 如果 我 们 使 用 这 种 对 Strassen 
算法 的 修改 算法 ， 则 最 后 积 矩 阵 中 的 元 素 值 可 能 会 大 到 n， 因 此 每 个 元 素 就 需要 一 个 字 来 存 
储 ， 用 一 位 是 不 行 的 。 更 令 人 担 居 的 是 中 同 结果 (也 是 整数 ) 可 能 会 更 大 。 为 了 不 使 中 间 结 果 
的 值 术 大 ， 一 种 办 法 是 对 所 有 的 计算 都 执行 模 n+1 和 运算。 练习 31.3-5 要 求证 明 执 行 模 nfl 
运算 不 会 影响 算法 的 正确 性 。. 


域 

如 果 一 个 环 ($， 外 ， 轩 ，0.0) 还 满足 以 下 两 条 性 质 ， 则 它 是 一 个 域 ， 

6. 运算 全 满足 交换 律 ， 即 对 所 有 a，bES， 有 aeb = be)a 

7. S 中 的 每 个 非 零 元 素 都 有 一 个 乘法 的 道 元 素 ， 即 对 所 有 asS - {10}， 都 存在 一 个 元 
素 bsS， 满 足 aeBb = bG@ia = TI。 这 样 的 元 素 称 为 a 的 道 元 素 ， 用 a "表示 。 

域 的 实例 有 实数 (R，+，. ，0，1D、 复 数 (C，+， . ，0，D 和 整数 模 - -个 质数 p 所 得 
结果 :(Z,，+，- ，0，1) 
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因为 域 中 提供 了 元 素 的 嫌 法 道 元 素 ， 所 以 就 能 在 域 上 进行 除法 运 等 。 另 外 ， 运 算 还 满足 
交换 律 。Strassen 通过 从 氢 环 推广 到 域 对 先 阵 乘法 算法 的 运行 时 和 介 进 行 了 改进 。 因 为 矩阵 的 
元 素 常 常 取 之 于 一 个 数字 系统 ( 例 嫩 实数 ) 所 以 ,有 人 也 许 希望 通过 在 类 似 Strassen 算法 的 递 
归 算 法 中 运用 域 而 不 是 环 , 就 能 够 进一步 改进 算法 的 运行 时 和 间 。 

这 种 方法 似乎 并 不 是 富有 成 效 的 。 要 使 一 个 基于 域 土 的 递归 分 治 算法 能 够 运行 ， 递 归 过 
程 的 每 一 步 所 产后 的 矩阵 都 必须 形成 一 个 域 。 遗 凡 的 是 ， 要 想 自然 地 把 定理 31.7 和 推论 
31.8 扩 雇 到 域 中 是 不 可 能 的 。 对 mn> 141, 即使 矩阵 元 素 所 组 成 的 数字 系统 是 一 个 域 ，a xn 和气 
阵 的 集合 也 决 不 可 能 形成 一 个 域 ， 因 为 nxn 抑 阵 乘 法 不 满足 交换 律 ， 并 且 许 冤 mxn 定 阵 
没有 道 矩 阵 。 因 此 ， 更 好 的 矩阵 和 溢 法 算法 也 许 只 能 基于 环 的 理论 ， 而 不 能 基于 域 的 理论 之 
让。 


31.4 求解 线性 方程 组 


” 对 一 组 同时 成 立 的 线性 方程 求解 是 很 多 度 用 中 都 会 出 现 的 基本 问题 。 一 个 线 挂 系统 可 以 
表述 为 … 个 提 阵 方程 ， 共 中 每 个 怎 阵 或 向 量 元 素 都 属于 一 个 域 ， 如 实数 域 RR。 在 本 他 中 我 
们 讨论 如 何 运 用 LUP 分 解 来 求解 线性 方程 组 。 

我 们 先 来 看 看 一 组 具有 mn 个 未 知 量 xl， 因 ，…， 克 的 线性 方程 : 
生 11 基 1 十 胆 12 关 : 十 和 十 号 一 ， 
站 | 十 呈 X 十 … 十 中 和， 一 bb， 
{31.17) 
日 1 藉 1 十 axz 十 十 ax 一 b。 


满足 (31.17) 中 所 有 方程 的 一 组 关于 x ，x.，…，x. 的 值 称 为 方程 组 的 一 个 解 。 在 本 节 


中 ， 我 们 只 讨论 存在 ma 个 未 知 量 的 n 个 方程 的 情况 . 
《31.17) 中 的 方程 可 重 呈 奶 人 下: 


和 有 习 X 了 ， 
和 得 3 X。 b， 
4 0 辣 n2 an bp。 
或 者 等 价 地 ， 设 A = (aj) x=(xh b= (bj)， 有 
Ax 一 申 {31.18) 
站 果 A 是 非 奇 异 扎 阵 ， 则 它 有 道 矩阵 A“， 并 且 
x 一 入 hb (31.19) 


就 是 解 若 量 ， 我 们 可 以 证 明 x 是 (人 1.18) 的 唯一 解 。 ` 剖 果 存 在 两 个 解 工 和 xx， 删 Ax 一 和 丰 X 
= 一 b， 虑 有 


一 《和 TAI 一 并 -AN 二 AUAXD 一 ( 彤 -Ar 一 轴 
在 本 节 中 ， 我 们 六 要 讨论 A 为 非 坷 蜡 矩 阵 ， 或 者 等 惟 地 { 由 定理 31.1)A 的 秩 等 于 未 知 最 
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的 个 数 na 的 情形 。 不 过 ， 对 其 他 可 能 的 情形 ， 我 们 也 作 了 简要 讨论 ， 如 果 方 程 的 数目 少 于 
未 知 量 数目 (或 更 一 般 地 ， 如 果 A 的 秩 小 于 种， 则 该 线性 方程 组 为 欠 定 方程 组 ， 一 个 欠 定 方 
程 上 共有 无 穷 多 组 解 (参见 练习 31.4-~9。 但 是 如 果 方 程 组 不 相 容 则 也 可 能 无 解 。 如 果 方 程 的 数 
目 超过 未 知 量 个 数 ， 则 该 方程 组 为 超 定 方程 组 ， 并 且 方 程 组 可 能 没有 解 。 如 何 找 出 超 定 线性 
方程 组 的 好 的 近似 解 将 在 第 31.6 节 中 详细 讨论 。 

现 东 让 我 们 园 到 求解 关于 n 个 未 知 量 的 线性 方程 组 Ax=b 的 问题 上 来 。 一 种 方法 是 计 
算出 A 一 ， 然 后 方程 组 两 边 都 来 以 A-1， 得 AIAx=A-b 或 x=A-b， 在 实际 庶 用 中 ， 这 种 
方法 的 缺点 十 数值 不 稳定 : 当 用 浮 点 数 代替 理想 的 实数 进行 运算 时 , 含 人 误差 趋 于 过 度 积累 。 
幸运 的 是 还 有 另 一 种 方法 一 -LUP 分 解 , 该 方法 具有 数值 稳定 性 ， 生 运行 速度 要 比 前 者 快 三 


倍 。 
UP 分 解 总 述 


LUP 分 解 的 思想 就 是 找 出 三 个 nxn 托 阵 直 ，U 和 了 P, 满足 
PA = EU {31.20) 
其 中 
工 赵 一 个 单位 下 莽 角 虐 阵 
-和 是 一 个 上 二 和 算 阵 
- 王 是 -- 个 排列 定 阵 
称 满 足 和 个 式 (31.20) 的 所 阵 站 ，U，P 为 和 阵 A 的 一 个 LUP 分 解 。 我 们 将 要 证 明 每 一 个 非 奇 
异 惠 阵 A 都 县 有 这 样 一 种 分 解 。 
对 征 阵 A 进行 LUP 分 解 的 优点 是 当 相 诬 第 阵 为 三 角 些 阵 ( 划 和 矩阵 工 和 U) 时 ， 更 容易 求 
鲜 线 性 系统 。 在 计算 出 A 的 LUP 分 解 后 ， 我 们 就 可 以 用 如 下 方式 对 三 角形 线性 系统 进行 求 
解 ， 也 就 状 得 (31.18) 中 Ax=b 的 解 。 对 Ax=hb 的 两 边 同 时 乘 以 P, 就 得 到 等 价 的 方程 组 
PAx 王 Pb。 根 据 练 习 31.1-2 可 知 ， 这 相当 于 对 (31.17) 中 的 方程 进行 排列 ， 运 用 (31.20) 的 分 
解 ， 得 到 ; 
LUX= Pb 
现在 我 们 通过 对 两 个 三 角形 线性 系统 求解 就 可 以 求 得 该 线性 系统 的 解 。 我 们 定义 
y= Ux， 其 中 x 就 是 要 求 的 解 向 量 。 首 先 ， 我 们 用 一 种 称 为 * 正 向 替换 ?的 方法 求解 下 列 下 三 
Ly= Pb {31.21) 
得 到 未 知 阿 量 yY。 然后 我 们 再 用 一 种 称 为 “逆向 替换 "的 方法 求解 下 列 上 三 角 线 性 系统 
Ux 王 7 (31.22) 
由于 排列 拭 阵 已 是 可 求 道 的 矩阵 (练习 31.1-2)， 因 而 向 量 x 就 是 Ax=b 的 解 。 
AX 一 P-LUx 
王 P-Ly 
一 P- Pb 
一 
我 们 下 一 步 将 先 说 明正 向 替换 与 道 向 替换 是 如 何 进行 的 ， 然 后 再 解决 如 何 计算 LUP 分 
解 的 问题 。 
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正 向 蔡 换 与 送 向 普 换 


如 东 已 知 L，P 和 b， 用 正身 替换 可 以 在 @Go 罗 的 时 间 内 求解 下 二 和 角 线 性 系统 (31.21)。 
为 方便 起 见 ， 我 们 骨 一 个 数组 榴 1.. 加 来 表示 排 询 P。 对 i=1，2，……，m， 放 这 说 明 疡 -1 
并 用 对 j 产 xz 加， 有 =0。 四 此 ，PA 的 位 于 第 直行 、 第 j 列 的 元 素 为 atj, Pb 的 第 i 个 元 素 
为 bl。 由 于 世 是 单位 下 .三 角 和 此 阵 ， 所 以 式 (31.21) 可 以 改写 为 
Y 


一 “0 
1y， 十 y 、 一 b 
1y， 十 1.y， 十 Y 3 一 bn 
1 ,y， 十 4.y， 二 13ya 十 一 上 bf 


很 必然， 由 第 -个 方 春 我 们 可 以 直接 求 出 y ,的 值 y, = b ，。 求 出 y 的 值 后 ， 把 它 代入 第 
个 方程 得 到 
y、 二 bi 一 二 yY， 
把 y ,和 y ,的 位 代入 第 . :个 方程 中 ， 得 
y ,一 b 一 避 ,Y 十 1.y)) 
一 般 地 ， 把 y ，y，，…， 了 “ 正 隔 ” 蔡 换 到 第 i 个 方程 中 就 可 求 出 y 的 解 。 


y， 一 中 2 1 y; 
逆向 昔 摘 类 似 上 于 正 阳 蔡 换 。 如 果 已 知 可 和 Y， 我 们 就 能 求 出 第 n 个 方程 的 解 ， 然 后 道 


向 逐次 求解 刘 第 1 个 方程 的 解 。 这 一 过 程 的 运行 时 间 也 是 @tn )。 由 于 日 是 -- 个 上 三 角 和 此 
阵 ， 我 们 可 以 抒 系 统 (1.22) 改写 如 下 : 


入 1 十 7 关 、 十 十 Di -2 汪 2 十 Di 1 基 1 十 局 in 兴 n 二 yy 
下、 从: 十 全 二 QU2u_ -zu 2 十 Uza_1 准 1 一 由 2 闪 。 一 y> 
am 2 共 _2 十 2n-1 共 -1 十 下 za 基 yn 一 
则 ta -1 -1 妈 。_ ia 共 yn_1 
日 na 了 
四 此， 我 们 可 以 被 旭 下 方式 顺序 求 出 x,，x。i，…，xXi 的 解 : 
， 一 Yu， 
1 一 性 ， 1 一 inXa)A La -1 
A ty 。 tu， 20 一 1Xn-1 十 UnXn 且 AD 一 24 一 了 


或 者 -上 股 地 有 : 


一 1 一 


x 一 必 yi, 一 > UiXiJ AUi 
如 果 已 为 P，U，L 和 hb， 下 击 的 过 程 LUP-SOLYE 通过 把 正 向 替换 与 道 癌 蔡 换 结 合 
起 来 而 求 出 x 的 基 ， 代 码 中 假定 维 数 n 出 现在 属性 rows[L] 中 ， 排 列 逢 阵 P 用 数组 r 表示 。 


工 吕 E 一 人 ELWwEILL， 呈 ， 严 hb 
nn Tows[ 工 
far 1= 直 ton 
Goy,，t 扫 一 》 1 ?9 


j -1 ”1 


dox ty 一 二-， 


LU 其 .) 愉 王 ， 
j = | 由 


1 

2 

3 

地 borie mdowntol 

S - 
] ] 

必 


TEKUTS 基 


过 程 LUP-SOLYE 在 第 2-3 行 中 使 用 正 问 替 换 求 出 了 y 的 解 ， 然 后 在 第 4-5 行 中 用 道 
问 昔 换 求 几 x 的 辞 。 由 于 在 每 个 for 循环 中 都 隐 含 了 一 个 求 和 的 循环 过 程 ， 所 以 算法 的 运行 
时 间 为 Gtn )。 

作为 这 上 遇 种 方法 的 应用 实例 ， 我 们 来 考察 下列 线性 系统 : 


1 2 0 0.1 
3 5 4| 大 = 上 12.5 
s 63 10.3 
其 中 
1 2 0 
A=|3514 
SS 6 3 
0.1 
b =| 13.5 
10.3 
并 且 我 们 希 户 求 得 未 知 量 x 的 解 ， 其 LUP 分 解 如 下 ， 
1 0 0 
L=|06 1 0 
0.2 0.$71 1 
S 6 3 
=| 0 14 2.2 
0 0 一 1.8S6 


一 319- 一 


001 
P=|010 
100 
(读者 可 以 验证 PA =LU。) 用 正 向 替换 法 求 出 Ly = Pb 的 解 : 
1 0 0 10.3 
06 1 0j17: |=| 12.5 
02 0.571 1 y | 工 04 
通过 先 计 算 y 、 然 后 y,。， 最 后 计算 出 y,， 得 
10.3 
v 王 | 632 ” 
一 $.569 
用 赣 由 蔡 换 冰 解 QUx 一 Yy 
5 6 3 1 10.3 
0 14 2.2 x，|=| 632 
0 0 一 1856 | | x， 一 5.569 
这 样 央 获 得 所 需 的 解 ( 按 x,，x,，x ,的 顺序 计算 》 
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关于 LU 分 解 的 计算 


现在 我 们 已 经 证 明 对 于 一 个 非 奇 异 矩 阵 A， 如 果 能 计算 出 其 LUP 分 解 ， 则 可 以 运用 正 
庙 郁 搞 与 反 向 幸 换 来 求 出 线性 方程 组 Ax=b 的 解 。 下 面 我 们 来 说 明 如 伍 有 效 地 找 出 矩阵 A 
的 LUP 人 分解。 我 们 先 采 考虑 A 是 nxn 非 奇异 抢 阵 并 且 了 缺 省 (或 等 价 地 ， 了 = JJ) 的 情形 。 
在 这 种 情形 卜 ，、 我 们 必须 找 出 困 式 分 解 A=LU。 和 拖 阵 工 和 U 称 为 A 的 LU 分解。 

我 们 把 找 行 LU 分 解 的 过 程 为 高 斯 消去 法 (Gaussian eltiminatiom。 先 从 其 他 方程 中 减 去 
第 一 个 方程 的 傍 数 , 以 便 把 那些 方程 中 的 第 一 个 变量 消去 。 然 后 ， 再 从 第 三 个 以 后 的 方程 中 
减 去 第 .个 方程 的 倍数 , 以 把 这 些 方程 的 第 一 个 和 第 二 个 变量 都 消去 。 继 续 上 述 过 程 直 至 系 
统 变 为 .个 上 = 用 让 阵 开 式 ， 这 个 乍 阵 就 是 U。 和 抑 阵 工 是 由 使 得 变量 被 消去 的 行 的 乘 数 所 

采 几 递 上 记 法 可 以 实现 这 一 策略， 我们 希望 构造 出 nxan 非 奇异 定 阵 A 的 一 个 LU 分 
解 ， 如 果 n= 1， 则 和 客 成 构造 ， 因 为 我 们 可 以 指定 站 =，U=A。 对 mn>1， 我 们 把 A 拆 成 
四 个 部 分 : 


一 520 一 


必 
| 


玫 
| 站 | 
P 


其 中 v 是 nm 一 !1 维 向 量 ，w - 是 mm 一 1 维 行 向 量 ，A" 是 一 个 位 一 Txt 一 TD 此 阵 。 然 后 ， 运 
诈 定 阵 代数 ， 我 们 可 以 把 A 分 解 为 ， 


开 
并 机 | 
YY 各 
了 
| 1 0 | 和 W 
Yi 1 ， 0 A': 一 vw /an 


上 述 分 解 中 第 一 个 第 阵 与 第 一 个 矩阵 中 的 0 分 别 玫 示 mn 一 1 维 行 向 量 与 na 一 1 维 列 问 景 。 
项 yw va ， 是 -个 人 nan- 1Dxtn 一 芒 抢 阵 ， 它 是 向 量 v 与 w 的 外 积 抢 阵 的 每 一 个 元 素 除 
以 a， 所 得 到 的 惠 阵 ， 与 矩阵 A“ 是 相 容 的 。 所 得 串 一 D xn 一 1 征 阵 
A 一 vw /人 (31.23) 
称 为 定 阵 A 对 于 a ,的 Schur 余 式 。 
现在 我 们 用 递归 方法 来 找 山 Schur 余 式 的 LU 人 分解， 我 们 说 
A 一 vwW “ai 二 LU- 


其 中 工 是 - -个 单位 下 三 角 惩 阵 ，U 是 一 个 上 三 角 和 矩阵。 运用 定 阵 代数 可 得 


工 
如 引 有 
上 一 上 
V7 ii 1 ， 0 AAA_wvw 1] 
| ] 蜂 | 引 | 机 
Via LI _， 人 TU 
-| ] -| 3 二 
VAN 二 0 1U 


= 一 工 U 

因此 我 们 就 找 出 了 A 的 LU 分 解 。( 注 意 ， 因 为 工 是 单位 下 注 角 答 阵 ， 所 以 工 也 是 单位 
证 三 角 算 阵 ， 又 因为 U' 是 土 三 角 短 阵 ， 所 以 U 也 是 上 三 角 插 阵 。) 

当然 ， 如 果 ai=0， 就 不 能 运用 这 种 方法 ， 理 则 就 会 产生 除数 为 0 的 情形 。 如 果 Schur 
祭 式 A 一 ww ai 的 左上 角 元 素 为 0， 这 种 方法 也 行 不 通 ， 内 为 在 下 一 次 递归 过 程 中 我 们 融 
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要 除 以 沪 元 素 ， 这 些 元 素 处 十 定 阵 U 的 对 角 线 上 ， 在 LUP 分 解 中 要 包含 一 个 排列 握 阵 P 
的 原因 就 是 为 了 使 我 们 能 够 避免 把 0 元素 作为 除数 ， 运 用 排列 来 避 印 除数 为 0( 或 一 个 很 小 
的 玖 ) 的 过 程 称 为 选 主 元 。 

保证 LU 分 解 总 能 进行 的 区 重要 的 符 阵 就 是 对 称 正定 和 矩阵。 对 这 一 类 扼 阵 无 需 选 二 
邢 、 因 此 可 以 从 容 地 运用 上 述 递 果 策 略 而 无 淖 担 心 除数 为 0。 我 们 将 在 第 31.6 节 中 证 明 这 
一 结论 和 生 他 -- 些 结论 。 

我 们 对 定 阵 进行 LU 分 解 的 代码 就 是 根据 上 述 递 归 策 略 设计 的 ， 只 不 过 我 们 用 迭代 循环 
代替 了 了 递 晤 过 程 。( 这 一 转化 是 对 * 尾 递 时 "过 程 进行 标准 的 最 优化 处 理 ， 所 谓 * 尾 递 晤 * 过 程 
鼻 指 过 程 的 最 后 -- 个 操作 是 对 其 自身 进行 递归 调用 的 过 程 。) 代 码 假定 A 的 规模 保存 在 属性 
rews[A] 中 ， 因 为 我 们 知道 输出 十 阵 U 的 对 角 线 以 下 的 元 素 均 为 0， 并 且 过 程 LU-SOLYVE 
并 没有 村 看 这 些 抑 夫 ， 所 以 代码 也 没有 填 人 这 些 元 素 。 同样 ， 因 为 输出 矩阵 工 的 对 角 线 上 
的 元 素 都 是 1、 对 第 线 以 上 的 元 素 都 是 0， 所 以 也 没有 把 这 些 ' 记 素 填 人 征 阵 。 因 此 ， 下 列 代 
码 仪 对 工 和 U 的 “有 意义 "的 郊 素 进行 了 计算 。 


EU 一 TDEC ORGOSTITIGCOMNILA) 

1 na Tows[ 上 ] 

2 foere 1 to 

3 可口 Use 且 人 

二 foT jia:K 十 1 tc 所 

5 do 二 -8 AU 六 二 圾 抽 症 
折 is 人 ui 表示 w; 
了 fear ts 必 +TL ton 

电 de forls:Kk+l ten 

咏 do air* 中 一生 Uni 

心 


[Tetorna 世 和 局 


2 3 1 5 和 3 1 5 2 3 1 5 2 3 1】 5 
6 13 5 19 3|4 2 4 3| 和 2 4 314 2 4 
2 19 10 33 1j16 9 18 1 43 3 | 4| 和 : 
4 0 1 31 214 921 2 1137 日 2 1 713 
fa] (b) fc td) 
23 1 5$ | 站 间 昌 23 1 5 
6 13 5 19 31000 4 2 4 
2 19023| 3410 00o1 32 
4 0 3] 2 171 DDO0O 3 
上 L 
人 


疼 31.1 LU 分 解 的 扫 行 过 程 
从 第 二 行 片 始 的 外 层 for 循环 对 每 个 递归 步 选 代 一 次 。 在 该 循环 内 的 第 3 行 确定 出 主 元 
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素 mr=ar。， 在 第 46 行 的 for 循环 内 ( 当 k=n 寺 ， 该 循环 不 执行 ) 用 v 和 w- 两 个 向 量 对 
L 和 人 进行 更 新 。 在 第 5 行 中 确定 出 向 量 Y 的 种 元 素 ， 并 把 w 存放 于 lf 中 ， 第 6 行 确定 出 
雷 量 w 的 若 拒 款 ， 并 把 w 存放 本 mw 中 。 最 后， 在 第 7-9 行 中 计算 Schur 余 式 中 的 餐 元 索 
. 首 把 它们 存放 在 皇 阵 A 的 相应 元 素 中 。 因为 第 9 行 语 旬 处 于 三 层 舍 套 之 中 ， 折 以 
LU-DECOMPOSITION 的 运行 时 间 为 @n3)， 
图 311 说 明了 LU-DECOMPOSITION 的 操作 过 程 ， 其 中 站 和 的 每 一 个 有 意义 的 
元 天 部 存放 于 年 阵 A 的 适当 位 置 上 。 就 是 说 ， 我 们 可 以 在 每 个 元 素 aj 与 1 若 i>j) 或 与 ul 
若 ji 一 ji 之 阿 记 和 实 某 种 对 订 美 系 , 更 新 定 阵 A, 使 得 过 程 终 止 执行 时 邱 阵 A 包 售 工 积 U 中 的 有 
意 叉 的 开 夫 ， 要 获得 这 -- 优 化 的 代码 , 只 要 把 上 述 代 码 中 的 1 或 吕 用 a 取 代 就 可 以 了 。 不 难 
证 明 这 -转化 方法 仍 使 算法 保持 其 正确 性 。 


LUP 分 解 的 计算 


-一般 情况 下 . 为 了 求 线性 方程 组 Ax=b 的 解 ， 必 须 选 主 元 以 避免 除数 为 0。 除 数 不 仅 丰 
能 为 0. 也 不 应 很 小 ， 格 则 就 会 在 计算 中 导致 数据 的 不 稳定 性 。 因 此 ， 所 选 的 志 元 必须 是 一 
个 较 大 的 值 ， 

LUP 分 解 的 数学 基础 与 LUP 分 解 相 亿 。 回 顾 上 面 ， 我 们 已 知 一 个 axn 非 奇 媒 算 阵 A 
并 希望 计 猎 出 -- 个 排列 定 阵 P， 一 个 单位 下 三 角 惩 阵 工 和 一 个 上 -= 角 和 矩阵 U， 并 满足 条 件 
PA=LU。 在 我 们 如 LU 分 解 中 那样 对 A 进行 分 解 以 前 ， 先 把 一 个 非 零 元 喜 ， 如 ai 第 一 列 
移 到 和 人 阵 (1 前 位 置 上 (如 时 第 一 列 仅 包含 0 元素 ， 则 矩阵 A 是 硼 异 官 阵 ， 因 为 由 定理 31.4 
和 31.5 可 知 其 行列 式 的 值 为 由。 为 了 使 方程 组 仍然 保持 成 立 ， 我 们 把 第 1 行 与 第 K 行 互 
换 ，、 这 实际 上 等 价 王 用 一 个 排列 和 抢 阵 中 去 乘法 (练习 31.1 一 2)。 


中 WwW 
QA=| “ 
| 天 3 | 


其 中 YY= 一 (aa a ) ， 但 其 中 用 a ， 代 痊 了 ai，，。 W 一 人 aa )， 入 


是 -个 人 nm 一 bxtn 一 说 年 阵 。 因 为 a ,和 关 0， 所 以 可 以 执行 与 LU 分 解 相 风 的 线性 代 郊 运 
算 ， 但 能 保 让 除数 不 会 为 和 


了 


| 病 aa w 
VY7 ai 1 ， 人 A' 一 ww /aa， 


Schur 余 式 A' 一 vw /al 是 非 毒 异 的 ， 理 则 的 话 ,上面 最 后 一 个 式 子 中 的 第 二 个 先 阵 
的 行列 式 值 为 0， 定 阵 A 的 行列 式 值 也 为 0。 但 这 样 一 来 就 意味 着 A 是 奇异 的 ， 这 与 我 们 
假设 A 是 非 坷 异 华 阵 相 了 矛盾。 所 以 ， 我 们 可 以 导出 对 Schur 余 式 的 一 个 LUP 分 解 ， 包 括 单 
位 下 = 角 征 阵 工 ， 上 : 角 第 阵 U' 和 排列 皂 阵 P 满 必 
PRA 一 vw Al 一 LU 
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1 0 
P 一 
0 P 


P 芋 一 个 排列 遇 阵 ， 国 为 它 是 酚 个 排列 惩 阵 的 乘积 (练习 31.1 一 习 。 我 们 现在 有 


1] 
bPA = 及 
0 疡 


| 
1 0 
民有 1f A' 一 vw /al | 
1 0 ww 
wa 本 国 P(A' 一 vw' | 


] 日 
PVA a 攻 0 | 
] 
-| 1 长 | 


这 样 训 得 到 了 LUP 分 解 。 久 为 王 是 一 个 单位 下 所 角 答 阵 ， 所 以 工 也 是 单位 下 二 角 和 矩阵， 
艾 因 为 可 "是 个 上 .三 基 重 阵 ， 所 以 _U 也 是 一 个 上 三 角 矩 阵 。 
注意 在 上 述 推导 过 程 中 ， 与 LU 分 解 中 不 同 的 是 ， 列 向 量 vy ak 和 Schur 祭 式 
A 一 ww 7 kl 都 必须 与 排 瑰 抵 阵 P 相 乘 ， 
与 TU-DECOMPOSITION 一 样 ， 我 们 为 LUP 分 解 设计 的 伪 代 码 也 采用 迭代 循环 以 
代 茵 遂 归 过 程 。 作为 对 直接 实现 递 果 的 一 种 改进 ， 我 们 设置 了 数组 来 表示 排列 矩阵 了 P， 
xz[=j 说明 的 第 工行， 第 j 列 的 元 素 为 1。 实 现代 码 时 我 们 回 样 地 计算 出 的 站 和 U。 因 此 ， 
当 访 过程 终止 执行 时 ， 有 : 
] 若 i>j 
U _ 若 i 所 j 


LECP-DPECOMPOSITICNCA) 
1 nn Tows[AA] 

] taoti-1ton 

3 deor[ijs i 

寺 forkas 1tobo 一 ] 

5 dn pa 站 

右 fGT js- to 生 

了 to 让 | aik| > 虽 


S then p<- | aix[ 






9 Ki 
10 ifp 一 0 
] 1 then error “ 霖 异 矩 阵 ” 
13 交换 可 =- 一 一 和 [下 
13 ter is 1 to 
14 do 交换 ae 一 av 
15 for js -K+l1tom 
1 全 do aivs aik ak 
17 for js-K+l to 
18 GO gj 天 -让 ij 一 息 k 和 kj 
一 | 1 2 0 2 .6 3| 和 5 4 1: 31| 
直 2z| 3 3 4 =- 2| 3 3 4 -3? 2 
3 和 和 5 4 : 2 0 2 .6 
4| -1] -2 34 -1 4 -[ -2 34 -1 4 
【1 fb) 
3 3 3 
| 2 1 1 
q | 2 2 
4 4 4 
3 3 3 
】 j 1 
C 业 本 
4 2 2 
0 nn 1 nn (让 2 6 1 0 0 0 5 5 4 2 
LO 3 4 -21 |14 1 0 0 0 -2 4 -2 
nm 1 5 4 2 1-2 5 1 0 0 0 4 加 
站 1 0 0 -1 -2 34 -1 60 4 1 0 0 0 .3 
忆 A 5 
全 


用 31.2 LUP 分 解 的 执行 过 积 


阴 31.2 说 明了 过 程 LUP-DECOMPOSITION 是 如 何 对 和 矩阵 进行 分 解 的 。 数 组 x 在 第 
2-3 行 被 初始 化 以 表示 单位 矩阵 。 从 第 4 行 开 始 的 外 层 for 循环 实现 了 递归 过 程 。 每 执行 一 
次 外 层 循环 ， 第 5-9 行 确定 村 找 出 其 LUP 分 解 的 @-k+1) x (n-k+1D) 和 矩阵 中 当前 第 1 列 中 的 
所 有 元 素 都 是 0， 则 第 10~11 行 报告 该 矩阵 为 奇异 和 矩阵。 为 了 选 主 元 ， 在 第 12 行 中 我 们 把 
琵 1 与 柜 kl 交 换 ， 在 第 13-14 行 中 把 矩阵 A 的 第 k 行 与 第 k' 行 进行 交换 ， 这 样 就 选 出 了 主 
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元 ai ({ 芝 对 整个 行进 行 交 换 旦 因为 在 上 述 方法 的 推导 过 程 中 ， 不 仅 A 一 ww 7 站 | 与 他 相 
冻 ， 而 卫 向 量 vy au 也 与 P 相 滋 )。 最 后 ， 在 第 15-18 行 中 计算 出 Schur 余 式 ， 所 用 的 方法 
可 TUP-DECOMPOSITION 中 第 4-9 行 的 计算 方法 相同 ， 不 过 这 里 的 计算 过 程 是 在 A 中 
“ 原 地 "进入 的 . 
因为 上 述 过 程 的 : 重 艇 套 结 构 ， 所 以 过 程 LUP-DPECOMPOSITION 的 运行 时 间 为 
Gin )，1LU-DECOMPOSITION 的 运行 时 间 相 同 。 因 此 ， 选 主 元 的 过 程 在 运行 时 间 中 皇 
多 占 一 个 沉 数 因子 的 部 分 。 


31.5” 道 矩 阵 


尽管 在 实际 应 用 中 我 们 -一 般 并 不 使 用 逆 年 阵 来 求 线性 方程 组 的 解 ， 而 是 运用 一 些 数值 更 
黎 定 的 技术 ， 如 LUP 分 解 来 求解 线性 方程 组 ， 但 是 有 时 仍然 需要 计算 一 个 矩阵 的 道 算 阵 。 
在 本 节 中 ， 我 们 论述 如 何 利用 LUP 分 解 来 计算 逆 矩 阵 ， 我 们 将 在 理论 上 对 是 否 能 利用 像 
Strassen 审 阵 乘法 算法 的 技术 , 如 速 赣 失 阵 的 计算 过 程 这 样 的 有 趣 的 问题 进行 讨论 。 确实， 
候 是 用 于 | 可 以 用 比 昨 常 的 办 法 更 色 的 算法 来 求解 级 性 方程 ， 才 蕉 动 了 最 初 的 Strassen 
俐 法 的 产 


根据 LUP 分 解 来 计算 逆 和 矩阵 


假 过 我 们 太一 个 重 阵 A 的 LUP 分解， 包括. 二 个 扎 阵 站 ，U，P， 并 满足 PA=LU。 如 
果 运 用 LU-SOLVE， 我 们 就 能 够 在 昌 (o) 的 运行 时 间 内 求 出 形 如 Ax=b 的 线性 系统 的 解 。 
由 于 LUP 分 解 仅 取 决 于 A 而 不 到 决 于 b， 所 以 我 们 就 能 够 再 用 @n5 运行 时 间 求 出 形 如 
Ax=b 的 另 -个 线性 方程 组 的 解 。 一 般 地 ， 我 们 一 旦 获得 了 A 的 LUP 分 解 ， 就 可 以 在 
Btkn) 的 运行 时 间 内 求 出 k 个 形 如 Ax=b 的 线性 方程 组 的 解 ， 这 上 个 线性 方程 组 只 有 bb 各 
不 相同 

方程 

AX 一 工 (31.24) 
可 以 看 出 形 如 Ax=hb 的 n 个 不 同 的 方程 组 的 集合 。 这 些 方程 定义 矩阵 飞 为 上 的 道 玫 阵 。 更 
精确 地 说 ， 设 X; 洪 示 的 第 i 列 ， 并 且 单 位 向 量 e 是 工 的 第 1 列 。 则 我 们 可 以 通过 用 LUP 
分 解 分 别 求 出 每 个 方程 组 的 Xi 的 方法 来 求 得 方程 (31.24) 的 X 的 解 : 

册 关 | 一 吕 
可 以 在 Bt 的 运行 时 间 内 求 出 每 个 X 的 解 ， 因 此 根据 A 的 LUP 分 解 来 计算 X 的 运行 时 
间 为 BtnD]。 由 于 在 @(o9 的 时 间 内 可 以 计算 出 A 的 LUP 分解 ， 所 以 也 可 以 在 B(n3 的 时 间 
内 确定 出 A 的 道 第 阵 A。 


矩阵 妈 法 与 逆 矩 阵 


现在 , 我 们 从 理论 上 证 明 : 对 黏 阵 乘法 的 加 速 运行 方法 可 以 转化 以 使 求 递 矩 阵 的 运算 速 
度 得 到 加 快 。 事 实 上 ， 我 们 可 以 证 明 更 强 的 结论 : 从 下 面 的 意义 上 说 ， 求 逆 矩 阵 运算 等 价 于 
矩阵 乘法 运算 。 如 果 Mtn) 表 示 求 两 个 nxn 和 矩阵 的 乘积 所 需要 的 时 间 ，I(n) 表 示 对 一 个 非 奇 
异 的 mxn 矩阵 求 道 矩 阵 所 需 的 运行 时 间 ， 则 KmJ= @(M(n)。 我 们 分 两 部 分 来 证 明 这 一 结 
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论 ， 首先 ， 我 们 证 明 Mn)=OGn)， 相 对 说 来 这 是 比较 容易 的 ， 其 次 我 们 再 证 明 
Im=O(MIn) 

.定理 31.14( 矩 阵 乘 法 运算 并 不 比 求 送 垂 阵 运 算 更 困难 ) 刀 果 我 们 能 够 在 ICp) 的 时 间 内 
求 出 一 个 nxanm 和 定 阵 的 道 矩 阵 ， 其 中 Im= an5 旦 满足 条 件 H3n= On)y， 则 可 以 在 
GEn7 的 时 间 内 求 出 两 个 nxn 矩阵 的 匀 积 。 

证 有 明 : 设 A 和 了 B 为 黄 个 nxn 和 矩阵， 我 们 希望 计算 出 其 乘积 C。 定 义 3ax3a 征 阵 了 D 如 


1L 六 总 


D=|0 LI 8B 


0 0 工 
D 的 道生 阵 为 
I 一 A AB 
D = 0 1I 一 B 
0 0 1I 


瑟 


因此 我 们 可 以 利用 D” 的 右上 角 的 mxn 子 扎 阵 计 算出 乘积 AB。 
我 们 能 够 在 @(n]= On) 的 时 间 内 构造 出 惩 阵 D， 然 后 用 OU(3o 力 =OUI(o)) 的 运行 时 
出 求 出 了 的 逆 和 矩阵 (根据 关于 Ion) 的 规则 条 件 ]。 四 此 我 们 有 
Mn)= OICn) 
注意 ， 只 要 Im 的 值 没有 大 的 跳 恋 ，Im) 就 能 满足 规 巾 条件。 人 蚀 如 ， 如 果 对 任意 常数 
c>0，d2>0，ln)= 昌 (ncslgcn)， 则 In) 就 能 满足 规则 条 件 。 


把 求 道 矩阵 问题 转化 为 矩阵 对 法 问题 


求 逆 和 矩阵 运算 并 不 比 矩 阵 飞 法 运算 更 困难 。 对 这 一 问题 的 证 明 依 赖 于 对 称 正 定 矩阵 的 一 
些 手 质 ， 这 些 性 质 将 在 第 31.6 节 中 证 明 . 

定理 34.42( 求 逆 矩 阵 运算 并 不 比 惩 阵 乘 法 运算 更 困难 ) ”如果 我 们 能 在 Mn) 的 时 间 内 计 
算出 两 个 nxn 实 和 矩阵 的 乘积 ， 其 中 Ma)= mn ), 且 对 0 k<n，、MG)=O(MnHGO)， 则 可 
以 在 DO(Mny 的 时 间 内 求 出 任何 mxa 非 奇异 实 答 阵 的 道 所 阵 。 

证 明 : 可 以 假定 n 是 2 的 守 ， 这 是 因为 对 任意 Xk>0， 有 : 


A 0 [An 0 

0 | 0 
久 此 ， 通 过 挑选 k 以 使 ntk 为 2 的 圭 ， 我 们 可 以 使 矩阵 的 规模 扩大 -- 倍 ,并 且 从 这 一- 规模 扩 
大 的 竺 案 中 获得 我 们 要 求 的 A '。 关 于 Mo) 的 规则 条 件 保证 这 一 扩展 对 运行 时 间 的 影响 , 不 
会 四 过 -- 个 常数 因子 。 


目前 ， 我 们 假定 nxamn 征 阵 A 是 对 称 的 正 有 限 扎 阵 。 我 们 把 A 划分 为 4 个 mn7Z2xpv2 
的 子 算 阵 : 
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工 
-| “ | . (31.25) 
C_ D 


则 如 果 我 们 设 


S-D-CBCcT (31.26) 
是 A 关 于 了 3 的 Schur 余 式 ， 则 我 们 有 

|B8 ”+B CS CB -BCS 

A” 一 op 1 (31.27) 


我 们 可 以 用 和 矩阵 乘法 来 验证 上 式 的 正确 性 (利用 AA ”= In)。 如果 A 是 对 称 的 正 邱 
阵 ， 根 据 第 31.6 节 中 的 引 理 31.13，31.14 和 31.15 可 知 ，B 和 8 都 是 对 称 的 正定 矩阵 ， 所 


以 B 和 S ”都 存在 ,由 练习 31.1--3 有 BC =(CB ) ，B CS 


一 上 


=(S-”CB”) 。 因 此 式 (31.26) 和 (31.27) 可 用 于 说 明和 包含 4 个 ny/2 xnv2 矩 阵 滋 法 的 递 
归 算 法 : 

C:.B” ， 

(CB )C-” 

S-' -(CB 一 ) 


(CB- ) (SCB ) 
由 于 我 们 可 以 用 关于 mn xnm 征 阵 的 算 东 来 计算 出 n72xn72 振 阵 的 习 积 ， 所 以 对 称 正 
定 拖 阵 的 逆 第 阵 可 以 看 下 而 的 运行 时 间 和 内热 行 。 
In 区 27ny7 轨 +4M+Om ) 
一 2Iny7 2 二 OOMCn)) 
一 CIMCn) 
现在 还 需 说 明 , 当 A 是 可 求 道 的 但 不 是 对 称 的 正定 矩阵 时 ， 可 以 用 称 阵 乘法 在 新 近 意 闵 
上 的 运行 时 间 来 计算 出 道 阜 阵 。 基 本 思想 是 ， 对 任意 的 非 奇 异 矩 阵 A， 和 矩阵 AIA 是 对 称 的 
(由 练习 31.1-3) 正定 搜 阵 《 同 定 理 31.6)。 主 要 技巧 在 于 把 求 A 的 逆 官 阵 的 问题 转化 为 求 
ATIA 的 道 矩阵 的 问题 。 
这 一 转化 是 基于 下 列 观 察 的 基础 之 上 : 当 A 是 一 个 非 奇 异 的 mxan 和 矩阵 时 ， 我 们 有 
A 一 (AIAA 让 AI 
这 是 因为 (AIA)IADA=(AIAT AIA)= 工 ， 并 且 一 个 矩阵 的 道 矩阵 是 唯一 的 。 因 此 ， 我 们 
可 以 这 样 来 计算 A 5 先 把 A: 与 A 相 乘 获得 AIA， 然 后 运用 上 面 的 分 治 算法 求 出 对 称 正定 
抑 阵 的 道 和 矩阵 ， 最 后 再 把 结果 乘 以 AI。 这 三 步 中 每 一 步 的 运行 时 间 都 是 O(M(n))， 因 此 可 
以 在 DUOMGn) 的 运行 时 间 内 求 出 任意 非 琳 蜡 实 拖 阵 的 六 扎 阵 。 
定理 31.12 的 证 明 过 程 , 对 A 是非 奇 异 矩 阵 的 情形 提出 了 一 种 无 需 选 主 元 就 能 求 得 方程 
组 Ax=b 的 解 的 方法 。 我 们 把 方程 Ax=hb 的 两 边 同 时 乘 以 AI， 得 到 (AIA)Jx= AIb。 由 于 
AI 基 可 求 道 的 ， 所 以 这 一 转化 不 会 影响 解 向 量 x， 这 样 我 们 就 可 以 通过 计算 LU 分 解 来 对 
对 称 的 正定 矩阵 进行 分 解 。 然 后 我 们 通过 运用 正 向 替换 和 首 向 替换 就 可 以 求 得 方程 右 端 是 
Arb 的 解 向 量 kx。 尽管 这 种 方法 在 理论 上 是 正确 的 ， 但 实际 上 过 程 LUP-DECOMPOSE 


一 528 一 - 


TION 执行 得 更 快 。LUP 分 解 所 需 的 算术 运算 次 数 要 比 前 者 少 一 个 常数 因子 ， 并 且 从 某 种 
程度 来 说 LUP 分 解 有 着 更 好 的 数值 性 质 。 


31.6 “对称 正定 第 阵 与 最 小 二 和 潍 通 近 


对 称 正 定 矩 阵 有 许多 有 趣 的 并 且 是 我 们 需要 的 性 质 。 例 如 : 它们 都 是 非 奇 抠 矩 阵 ， 并 旧 
可 以 对 其 进行 LUP 分 解 而 无 需 担 心 出 现 除数 为 0 的 情况 。 在 本 节 中 ， 我 们 将 证 明 其 他 几 条 
关于 对 称 正 定 先 阵 的 性 质 , 并 说 明 一 个 用 最 小 二 习 逼 近来 进行 曲线 氢 合 的 有 趣 应 用 实例 。 

我 们 要 证 明 的 第 一 条 性 质 大 概 也 是 量 基 本 的 一 条 性 质 。 

引 理 31.143 ”任意 对 称 正定 矩阵 都 是 非 奇 异 惩 阵 。 

证 明 :， 假设 抱 阵 A 是 奇异 的 ， 则 由 推论 31.3 可 知 存在 一 个 向 量 大 铀 足 Ax=0。 因 此 ， 
x Ax 一 0， 这 样 A 就 不 可 能 是 正定 矩阵 。 

要 证 明 可 以 对 一 个 对 称 正 有 限 上 矩阵 A 进行 直 U 分 解 而 不 会 出 现 除 数 为 和 的 情况 ， 还 要 
涉及 另外 一 些 知识 。 我 们 先 来 证 明 关 于 A 的 某 些 子 和 矩阵 的 性 质 。 定 义 A 的 第 k 个 主子 施 阵 
为 A 的 前 面 的 帮 行 和 前 面 的 苹 列 交叉 的 元 素 组 成 的 矩阵 Au。 

引 理 31.14 ”如果 A 是 一 个 对 称 的 正定 矩阵 ， 则 A 的 每 一 个 主子 矩阵 都 是 对 称 的 入 上 
定 的 . 

证 明 : 每 个 主子 矩阵 Av 显然 是 对 称 的 . 为 了 证 明 Ak 是 正定 的 ， 设 工 是 一 个 k 维 非 堆 
列 问 量 。 对 入 划分 如 下 : 


工 
的 B | 
B CC 


则 我 们 有 


x ALx 中 |] 


-fir o]A 四 


> 站 
因为 A 古 正定 的 ， 因 此 A, 也 是 正定 的 。 


我 们 现在 来 讨论 Sehur 余 式 的 几 条 重要 性 质 。 设 A 是 一 个 对 称 正 定 矩阵 ，A, 是 入 的 k 
xk 主子 矩阵 。 把 A 划分 为 


和 闻 
A 二 (31.28) 
B CC 

则 年 阵 A 关 于 A 的 Schur 余 式 定义 为 


S=-C 一 BA-B” (31.29) 
(根据 引 理 31.14，Ak 是 对 称 的 和 正定 的 , 因此 ， 由 引 理 31.13 可 知 A， 存在 ， 这 样 $ 就 具 
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有 完善 的 定 多 。) 广 意 ， 若 设 k=1， 则 我 们 先前 对 Schur 余 式 的 定义 (31.23) 与 定义 (31.29) 是 
-- 致 的 ， 

下 面 的 一 条 引 理 说 明 对 称 正定 插 阵 的 Schur 余 式 抢 阵 本 身 也 是 对 称 的 和 正定 的 ， 我 们 在 
定理 31.12 中 用 到 了 该 结论 ， 并 有 旦 我 们 还 要 用 其 推论 来 证 明 对 称 正 定 上 矩阵 的 LU 分 解 的 正确 
性 。 

. 引 理 31.15S(Schur 余 式 引 理 ) 如 果 A 是 一 个 对 称 正定 抢 阵 ，Ak 是 A 的 kxxk 主子 扎 
阵 。 则 A 关于 A, 的 Schur 余 式 也 是 对 称 的 和 正定 的 。 

证 明 : 由 练习 31.41-7 可 咎 SS 是 对 称 的 。 现 在 还 要 证 明 &8 是 正定 的 。 考 察 (31.28) 中 对 入 
的 划分 。 

对 任何 非 零 向 量 x， 根 据 假 设 我 们 有 xTAx> 0。 我 们 把 x 拆 成 两 个 子 向 量 y 和 z， 分 别 


与 Au 和 C 相 容 。 因 为 A 一 存 在 ， 所 以 我 们 有 


民 
点 了 Y 
urAx-[ynar]| | ] 
B CC < 


=-y AuytyTB7z+zTBy+zTCz 
=(9+A BDI Ay+A BDI+zrC 一 BA BT7)z (31.30) 

《我 们 可 以 用 矩阵 匀 法 来 进行 验证 )。 最 后 这 个 式 子 相当 于 盖 次 式 的 “完全 平方 式 *”( 见 
练习 31.6 一 2)。 

因为 x Ax>0 对 任意 非 零 向 量 x 都 成 立 ， 我 们 可 以 挑选 一 个 任意 的 非 零 向 量 z， 然 后 
选择 y = -- A，B z， 这 样 就 把 式 (31.30) 中 的 第 -项 消去 ， 剩 下 

z (C 一 BA B )z=z Sz 四 
作为 表达 式 的 值 ， 对 任意 z 关 0， 我 们 有 : 
zz Sz 一 XTAX > 0， 所 了 以 页 是 绰 定 的 。 

推论 31.16 ”对 个 对 称 正定 矩阵 进行 下 U 分 解 不 会 出 现 除 数 为 0 的 情形 。 

证 好: 设 A 基 一 个 对 称 的 正定 矩阵 。 我 们 将 证 明 一 个 比 推论 更 强 的 结论 : 每 个 主 元 都 
严格 为 让 。 第 一 个 主 元 为 al。 设 el 是 第 一 个 单位 向 量 ， 由 此 我 们 得 到 ai=e'Ae >0。 因 
为 LU 分 解 的 第 -- 步 产生 的 是 矩阵 A 关于 由; 一 旨 ) 的 Sechur 余 式 ， 所 以 引 理 31.15 说 明 由 
归纳 可 知 所 有 前 主 天 都 是 企 值 。 

最 小 二 双 泛 近 

对 给 定 一 给 数 据 的 点 进行 曲线 拟人 台 是 对 称 正 定 矩阵 的 一 个 重要 记 用 。 盆 设 给 定 冲 个 
点 ; 

(1， y 1 小 《其 YY 中， 机 (x。， y - 
其 中 已 知 % 受到 油 量 误 状 的 影响 。 我 们 希望 找 出 一 个 函数 Ftx), 满足 对 i 王 1，2，…，m， 
有 : 

yi 一 下 (ojH， 03130 
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其 中 近似 误差 是 很 小 的 。 函 数 Etx) 的 形式 依 顿 于 我 们 所 遇 到 的 问题 。 在 此 ， 我 们 假定 沁 
的 形式 为 线性 加 权 和 | 


FOOD 一 之 cifioo 


其 中 和 项 的 个 数 n 和 特定 的 基 函 数 1 取决 隆 我 们 对 问题 的 了 解 。 一 种 选择 是 fC0)= 姑 ， 这 
也 说 时 
FEf(x) = ci+CzXTHC3X 十 … 二 Cn 

是 … 个 x 的 nl 次 和 多项式。 

通过 选择 n=m， 我 们 就 能 确切 地 计算 出 式 (31.31) 中 的 每 一 个 Yi。 但 这 样 一 个 贞 次 婚 数 
F 尽管 容易 处 理 孝 据 ， 但 也 容易 对 数据 产生 “和 干扰"， 并 且 一 般 在 对 未 预见 到 的 x 值 预见 其 必 
应 的 y 值 时 其 精确 性 也是 很 差 的 。 遂 常 , 较 好 的 铂 法 是 选 择 比 王 小 得 多 的 nan， 并 且 通 过 思 择 
系数 s， 使 我 们 获得 的 蝴 数 F 能 够 发 现 数据 点 的 显著 模式 。 从 理论 上 讲 ， 选 择 n 此 满足 一 
些 原则 ， 但 这 不 是 我 们 在 本 书 所 讨论 的 范围 。 在 任何 情况 下 ， 一 旦 选 定 了 n， 我 们 就 着 进 了 
我 们 希望 尽 可 能 好 地 对 其 求解 的 一 个 超 定 方程 组 。 我 们 现在 来 说 明 其 过 程 。 


fCx (xi fx 


二 (x:) 人) 人 《< 


f tx ) fx 7 f (x 》 
表示 基 困 数 在 给 定 的 点 的 值 的 矩阵 ， 即 a 一 有 (让 。 设 e= (4c) 表 太 所 要 求 的 系数 组 成 的 nm 
维和 疝 量 ， 则 

fx ) fx，》 … f (x ，}》 尼 


fx ) fx … 了 人 信 ) C 
AC 一 1 工 了 了 十 了 
人 人，) 六 人) 机 fx ) 和 
FGx ) 
Ex ,) 
F(Cx ) 
是 由 y 的 “被 预见 的 值 ” 组 成 的 和 癌 维 儿 量 ， 因 此 ， 
放 一 Ac 一 Y 
基 通 近 误 差 的 各 维 辐 量 。 


为 了 使 逼近 误 差 最 小， 我 们 选 定 使 误差 向 量 # 的 范 数 最 小 ， 就 得 到 一 个 地 小 二 碟 解 ， 因 
为 
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和 ?| 三 (2 


又 因为 
Im mm 人 
lz 有 = 一 Ac 一 yl = 2( Zuo -yj 


i=1 Ai=1 


所 以 我 们 可 以 通过 对 每 个 c 求 ly 手 的 微分 再 使 结果 为 0 来 求 出 | 的 最 小 值 :. 
da -az( Zauo- yj -。 本 (31.32) 


=1 


AL 2 2，…，n，(31.32) 中 的 n 个 方程 等 价 于 下 面 矩阵 方程 : 
(Ac 一 六 入 一 人 
或 等 价 地 (利用 练习 31,1 一 3): 
A (Ac 一 凡 =0 
这 意味 着 
A Ac 一 A y {31.33) 
在 统计 学 中 ， 该 式 称 为 正 态 方 程 。 由 练习 31.1 一 3 可 知 A A 是 对 称 和 矩阵， 并 且 如 果 A 
为 列 满 秩 ， 则 A A 也 是 正 有 限 和 矩阵。 因此 ，(A A)”' 存在 ， 方 程 31.33) 的 解 为 
c= (AAA) -ADy 
=Ar+y (31.34 
其 中 矩阵 A， - (ATAJ-!AT) 称 为 矩阵 A 的 伪 道 矩阵 ， 伪 道 矩阵 是 道 矩 阵 的 概念 在 A 不 
是 方 阵 的 情形 中 的 自然 推广 。( 式 1.34) 可 以 作为 Ac= y 的 近似 解 ， 把 它 与 Ax 一 b 的 精确 


解 人 Ab 进行 比较 。) 
作为 最 小 二 乘 拟 合 的 一 个 实例 ， 假 定 我 们 有 五 个 点 的 数据 
(一 1， 人 (1，1，(2，1)， 人 ， 人 办，(3，3) 
如 图 31.3 中 的 黑 点 所 示 ， 我 们 希望 用 一 个 二 次 多 项 式 对 这 些 点 进行 拟 合 
E(o 一 CI 十 C2X 二 CSX- 


我 们 先 构造 出 基 畏 数值 的 矩阵 
1 X， X ， 
.|Tl1 -1 
1 X， 式 ， 1 1 
A=ljlx xz 人 1 2 4 
| > 3 1 3 纺 
， 1 5 25 
1 X 区 
其 伪 道 筷 阵 为 : 
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0.500 “0.300 0200 0.100 一 0.100 
A =| -0.388 0.093 0190 0.193 一 0.088 
0.060.， 一 0.035 一 0.048 一 0.036 0.060 
再 把 A“” 与 y 相 乘 ， 我 们 就 得 到 系数 向 量 
1.200 
一 | 一 0.7537 * 
上 o214 
它 对 应 于 二 次 多 项 式 
Fo = 1.200 一 0.757x 十 0.214x、 
在 最 小 二 乘法 的 意义 上 ， 上 式 是 对 已 知 数据 的 最 接近 的 二 次 拟 合 ， 
在 实际 应 用 中 ， 我 们 按 如 下 方式 求 正 态 方程 (31.33) 的 解 : 先 把 A: 与 y 相 乘 ， 然后 求 出 
AA 的 LU 分解 。 如 果 A 为 列 满 秩 ， 则 可 以 保证 上 定 阵 A'A 为 非 奇 异 和 矩阵， 这 是 因为 它 是 对 
你 正定 矩 跨 。 
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图 31.3 对 点 集 {(-1.2)50LD,2.103.0).(05.3)} 用 二 次 多 项 式 进行 最 小 二 乘 拟 侣 的 过 程 


思 考 题 


31 一 1 Shamir 布尔 矩阵 氏 法 算法 


在 31.3 节 中 ， 我 们 注意 到 ，Strassen 矩阵 乘法 算法 木 能 直接 应 用 于 布尔 矩阵 的 乘法 运 
算 ， 这 是 因为 布尔 拟 环 Q= ({(0，1}，V， 和 人 人 ，0，D) 不 是 一 个 环 。 定 理 31.10 说 明 如 果 在 
OUgn) 个 位 组 成 的 字 上 进行 算术 运算 ， 我 们 就 能 够 在 OO s ) 的 时 间 内 把 Strassen 方法 应 用 于 

， 。 四 。 名 
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求 mxn 布 尔 矩阵 的 乘积 。 在 本 问题 中 ， 我 们 探讨 一 种 或 然 的 方法 ， 用 该 方法 仅 使 用 位 操作 
就 可 以 获得 近似 于 上 述 时 间 的 运行 时 间 荡 围 ， 并 且 出 错 的 可 能 性 也 很 小 。 

a. 证明: R= (10， 革 ， 申 ， 人 入，0，1) 是 一 个 环 ， 其 中 由 是“ 异 或 "函数 ， 

设 A=(ai) 和 日 =(bj) 是 nxn 布 尔 失 阵 ， 设 C=( 呈 =AB 属于 拟 环 Q， 使 用 下 列 随机 性 
过 程 ， 从 和 产生 恒生 "一 全 让: 

- 姐 果 aij=0， 则 设 a5=n0 

:如果 aii=1， 则 a“ =1 的 概率 为 17 2，a0= =0 的 概率 也 是 17/ 2， 并 且 每 个 元 素 的 

征 机 选择 是 相互 独立 的 。 

b- 设 C 一 ci=AB 赂 于 环 R。 证 明 : si=0 说 明 ci=0， 并 县 ci 一 1 说 明 ci= 1 的 概 
率 为 17 2。 

c. 证 明 : 对 任意 K > 0， 抢 阵 A' 中 某 个 指定 的 c 在 lg(n27 C ) 次 独立 的 选择 中 都 没有 取 
ci 的 值 的 概率 至 多 为 《 /nm 。 证 明 : 所 有 的 oy 至 少 有 一 次 取得 其 正确 值 的 概率 至 少 为 ] 一 

d.、 敌 出 一 个 这 行 时 间 为 Onelgn) 的 随机 性 算法 ， 对 任意 常数 k> 0， 该 算法 能 在 布尔 
拟 环 中 中 计算 出 两 个 mxa 征 阵 的 积 的 概率 至 少 为 : 1-17 an， 对 矩阵 中 的 元 素 仅 允许 执行 
以 下 操作 : 六 ，Y 和 中 ， 


31-2 三 对 角 线 性 方程 给 
池 察 下 三 对 朋 宇 阵 :， 


a. 求 出 算 阵 A 的 LU 分 解 。 

b. 遂 过 运用 正 向 昔 换 与 逆 沿 赫 换 求 方程 Ax=[l 1 1 1 1 二 5 的 解 。 

c. 求生 的 道 矩 阵 。 

d4. 让 明 : 对 任意 的 nxn 对 称 的 、 正 定 的 、 三 对 稍 扎 阵 A 和 任意 nm 维 向 量 bp， 通过 进行 
JU 分解 可 以 在 DOm 的 时 间 内 求 出 方程 Ax=hb 的 解 。 论 证 在 最 坏 情 形 下 ， 从 央 近 意义 上 来 
看 基于 求 出 A ”的 任何 方法 都 要 花费 更 驳 的 代价 。 

fs. 证 册 : 对 任意 nxn 非 奇异 的 三 对 角 和 拖 阵 A 和 任意 nm 维 向 量 b， 通 过 进行 LUP 分 解 
可 以 在 Do) 的 运行 时 间 内 求 帅 方程 Ax=b 的 解 。 


31-3 样 条 


把 一 组 点 插值 到 一 个 曲线 中 的 一 种 实用 方法 是 运用 三 次 样 条 。 已 知 mH 个 点 的 值 对 组 
迷 的 集合 ts，y0: i=0，1，…， 圳 ， 其 中 z<a<…<z。 我 们 希望 拟 合 出 这 些 点 的 分 段 
三 次 曲线 ( 样 条 )ftxz)。 就 是 说 ， 曲 线 Too 由 个 三 次 和 多项式 : fa)= aiHbxHcx2Hdxs， 人 = 0， 
1，、…，m 一 1 组 成 ， 其 中 刘 果 xx<a:l， 则 曲线 的 值 由 式 fo9= fx-x) 给 出 ， 把 三 次 多 项 
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式 " 粒 "站 一 起 的 点 辐 称 为 结 。 为 了 简单 起 见 ， 候 定 风 = 一 ii=0，1，…，n。 
为 了 保证 foo 的 连续 性 ， 我 们 要 求 对 i=0，1，…，H-1 
人 xi 一 和 人 三 区 
拭 Xi+ 雪 一 所 且 一 Yi 
为 了 保 让 fx) 足 馈 光 请， 我 们 同时 要 求 每 个 结 的 一 阶 导 数 是 连续 的 : 
fx )=PD)=P IO i=0， 1，…，n-1 
a. 假定 对 ij=0，1，…，mn， 我 们 不 仅 已 知 点 的 秆 对 {x，y 和 站， 府 上 已 庆 每 个 结 的 …… 阶 
导数 Di= 作 zx。 试用 值 让，yi，Di 和 Di 来 表述 每 个 系数 aa，b，cy di( 广 意 x=i。 根 据 
点 的 全 对 和 … 阶 导数 来 计算 出 4n 个 系数 需要 多 少时 间 ? 
如 何 选择 fx 在 每 个 结 的 一 阶 导 数 依然 是 一 个 问题 。 一 种 方法 是 昌 求 一 阶 导 数 在 每 个 结 
保持 连续 ; 
ft 一 (GDD= 人 (0 ii=0，1，…，nr-l 
下 第 一 个 结 和 最 后 一 个 结 ， 我 们 假定 PFC) 王 fa(0=0，fP(0x) 一 六 (一 0 这 些 假设 使 
得 ft 成 为 一 个 日 然 数 的 于 次 样 条 ， 
b. 利用 : 阶 导 数 的 连续 性 来 证 明 对 1i= ，2，…，m1 


Di-T4DPiHDH 三 3YH 一 -1 (31.35) 
c， 证 [ 明 

2Du+D=30y 一 yo) (31.36) 

DT2Dn 一 3(ya 一 yn- (31.37) 


d. 把 (31.35)-(31.37 中 的 等 式 改写 为 包含 关于 林 知 量 的 向 量 D= <Du，D，…，D,> 
的 一 个 所 阵 方程。 

e. 论证 用 日 然 数 的 :次 样 条 可 以 在 -OOm 的 运行 时 间 内 对 一 组 n+l 个 点 的 值 对 进行 揪 
值 。( 抑 问题 31.2) 

f 试 说 明 即 使 当 xi 不 一 定 等 于 i 时， 如 何 确定 出 -- 个 自然 数 的 二 次 样 条 对 一 -组 n+1 个 
点 Ci， 的 进行 插值 并 满足 xo<a 二 人 < 入 。 需 要 求解 什么 样 的 得 阵 方程 ?所 给 出 的 算法 的 运 
行 速 诬 和 多 快 ? 


练习 三 于 一 


3 了 .1 一 训 : 明 : 随 个 下 兰 基 如 阵 的 积 从 然 是 一 个 下 三 砷 所 阵 。 证 明 ; -前 形 ([:: 第 或 下 汉 有 用) 证 阵 的 行列 
起 的 信和 是 共 对 佣 线 上 的 元 未 之 积 。 证 明 : 一 个 下 三 角 猎 阵 如 果 存 在 道 抢 阵 ， 则 逆 插 阵 也 是 -- 个 下 天 角 移 阵 。 

31.1-2 让 曙 : 妇 里 总 一 个 mxa 排列 插 阵 ， 和 由 是 一 全 mxn 证 降 ， 则 可 说 把 A 的 各 行进 行 排列 以 得 到 
pA， 而 把 和 的 各 列 进行 排列 可 获得 Ap。 

证 叫 : 是 全 排列 盾 阵 的 生 积 仍然 是 一 个 排列 第 阵 ， 并 证 明 : 如 果 站 是 -个 排列 吓 阵 ， 则 让 是 可 求 道生 
阵 。 其 道 拓 阵 为 bB"、 上 县 hp ”也 是 一 个 排列 宣 。 

31.1 一 3 证 明 ;(AB) = B AT ,日 A7A 总 是 一 个 对 称 扎 阵 。 

31.1 一 4 证 明 , 如 果 宙 了 阵 了 和 居 玫 是 和 的 道生 阵 ， 则 了 肌 王 。 

3j1.1--5 区 和 A 和 有 是 nxa 定 阵 ， 且 有 AB=J 证 骨 : 如 果 把 上 的 第 j 行 如 到 第 j 行 谭 得 语 站 '， 几 
我 们 可 以 道 过 把 站 的 第 j 列 减 去 第 ; 列 而 获得 A 的 淫 年 阵 B/. 

31.1 一 6 议 上 是 一 个 非 奇 尼 的 9 xn 复 答 。 证 明 ;A ”的 个 个 元 素 帮 星 实 数 当 日 仅 当 二 的 和 伍 个 雹 
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素 都 是 实数 。 

31.1 一 7 证 明 , 如 果 宇 是 一 个 非 奇 异 对 称 符 阵 ， 则 A& 也 是 一 个 对 称 矩 阵 。 证 明 : 如 果 如 是 一 个 尾 
意 ( 相 容 ) 证 阵 ， 则 BAB ”是 对 称 矩 阵 。 

3 一 8 证明: 如果 年 阵 站 为 列 满 稚 汝 且 仅 当 若 Ax = 和， 则 说 明 x = 四 《提示 : 稍 用 列 向 量 的 线性 
独立 表达 式 ) | 

314.1 一 9 证明 : 对 任意 两 个 相 容 矩阵 A 和 B，rank(AB) <Tmmintrank(A)，rank(B2， 其 中 等 号 仅 当 入 
或 日 是 非 奇 旺 方 阵 时 成 立 , (提示 : 利用 矩阵 秩 的 另 一 种 等 价 定义 ) 


34.1 一 1 已 郑 数 x,，x ，…，x，,， 证 明 范 德 莞 年 阵 
] 0 xx “ 0 
] 基 xi， X 


的 行列 式 


detfVx，x，… 一 你 一 <) 


必 空 要 丰 实 阅 下 


( 提 上 所 : 把 第 1 列 科 以 一 x， 加 到 第 1+1 列 圭 ，i 一 mn 一 1 于 一 2， 一 ，1， 然后 再 使 用 归纳 法 ， ) 


31.2-t 适用 Strassen 算法 计算 抑 阵 积 
1 3 总 车 
|， 了 | | ， | 

说 明 计 算 过 程 。 

31.2-2 如 果木 是 2 的 整数 状 ， 应 如 何 蜂 改 Strasscn 算 藻 以 求 出 两 个 maxn 和 邱 阵 的 积 ?证 明 走 改 咎 的 
算法 的 运行 时 间 为 虽 (ne7) 

31.2-3 如果 使 用 k 次 乘法 ( 候 定 乘法 不 满足 交换 律 ) 就 能 计算 出 两 个 3 x 3 的 矩阵 的 积 ， 就 能 在 Otnt) 
的 运行 时 间 内 计算 出 两 个 nx 矩阵 的 和 溢 积 ， 满 足 上 述 条 件 的 最 大 的 大 值 是 多 少 ? 这 一 算法 的 运行 时 间 又 将 
是 多 少 ? 

31.2-4 YYV.Pan 发 现 了 一 种 使 用 了 132 464 次 靳 法 的 求 志 x 寻 眶 阵 的 方法 ， 一 种 使 用 了 143 640 次 科 
法 的 求 70 x 70 答 阵 积 的 方法 , 以 及 一 种 使 用 了 155 424 次 乘法 求 ?2 x 32 矩阵 积 的 方法 。 当 用 于 分 治 的 矩阵 
委 法 算法 时 、 哪 一 种 方法 可 以 获得 渐 近 意义 上 最 好 的 运行 时 间 ? 把 它 与 Strassen 算法 的 运行 时 间 进 行 比较 。 

31.2-5 用 Strassen 算法 作为 子 例 行 程 序 ， 能 在 多 长 时 间 内 计算 出 一 个 ka xn 符 阵 与 一 个 mx ka 矩阵 
的 乘积 ?如 果 把 输入 托 阵 的 次 序 颠 例 一 下 则 情况 又 如 何 ? 

312-6 说 明 如 何 仅 用 三 次 实数 乘 法 运算 就 可 以 计算 出 复 束 a+bi 与 c+ 古 的 乘积 ， 该 算法 应 该 把 a， 
b,， “和 由 作为 输入 并 分 谢 牛 或 实 部 ac-bd 和 虚 部 ad+be 的 值 。 


31.3-1 Strassen 算法 对 数字 系统 (Z[xj，+，- ，0，1) 能 否 正 常 运行 ?其 中 ZX 是 所 有 关于 x 的 整 系数 
多 项 式 的 集合 + 与 - 是 普通 的 多 项 式 如 法 与 匀 法 。 

31.3-2 ” 试 说 明 为 什么 Strassen 算法 不 能 在 闭 半 环 (参见 第 26.4 节 ) 或 布 条 氢 环 {10，]j，， 六 ， 路 江 
上 和 运行? ， 

31.3-3* 证 明定 理 31.7 和 推论 31.8。 

31.3-4* 证明 布尔 拟 环 ({0， 甘 ，Y， 入 ，0，1) 不 可 能 嵌 人 于 一 个 环 内 。 即 证 明 不 评 能 把 汪 二 加 入 报 
环 中 就 能 使 所 产生 的 代数 系统 是 一 个 环 。 . 

31.3-5 论证 如 果 汗 理 31.10 的 算法 中 的 所 有 计算 过 程 都 执行 模 n+l 运算 ， 则 算法 依然 正确 。 
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31.3-6 说 明 如 何 有 效 地 确定 一 个 给 定 的 无 向 图 是 否 包 含 一 个 三 角形 (三 个 互相 邻接 的 早点 )。 

31.3-7 了 *+ ”证明 在 布尔 氢 环 上 计算 上 两 个 nxta 布 尔 第 阵 的 入 积 可 区 转 化 为 计算 一 个 给 定 的 由 3 个 结 
点 组 成 的 有 向 图 的 传递 闭 包 。 

31.3-8 说 明 如 何在 One'sgn) 的 运行 时 间 内 计算 出 某 给 定 的 包含 站 个 结 点 的 有 向 图 的 传递 闭 包 。 试 把 
结果 与 第 26.2 节 中 过 程 TRANSITIVE-CLOSURE 的 进行 性 能 比较 


31.4 一 1 运 诈 正 向 替换 法 求解 下 列 方程 组 


1 001 3 

4 10|1z = 1 1 

-65 11x， 一 了 
31.4 一 2 求 出 下 列 和 矩阵 的 LU 分 解 : 

4 -5 6 

8 一 6 了 

12 一 了 12 


31.4 一 3 “为 什么 进程 LUP -了 PECOMPOSITION 中 第 4 行 的 for 循环 充 技 行 到 na 一 1 为止， 而 世 
一 DECOMPOSITION 中 第 2 行 相 应 的 for 御 环 却 一 直 执 行 到 na 为 止 ? 
31.4 一 4 运用 LUP 人 解 求解 下 列 线 性 系统 : 


1 3 4 关 1 1 
20 3 其 | = 一 | 全 
5 名 了 X， 他 


31.4 一 5 试 描述 一 个 对 角 矩 阵 的 LUP 人 分解。 

31.4 一 6 试 描 述 一 个 排列 矩阵 A 的 LUP 分 解 ， 并 证 明 它 是 唯一 的 。 

31.4 一 ?了 证 明 :对 所 有 mn > 3， 存在 具有 LU 分 解 的 奇异 的 n x n 矩 阵 ， 

31.4 一 8* 说明 如 体能 有 兹 地 来 得 定义 在 布尔 类 环 【 折 ，jj，Y， 信 ，0， 二 上 的 形 如 Ax= 的 方 穆 
组 的 解 。 

31.4 一 9x 租 设 A 是 一 个 秩 为 的 得 xmn 实 矩阵 ， 其 中 姻 <n。 说 明 如 何 找 出 一 个 a 维 向 量 x 和 一 
个 秩 为 mn 一 年 的 m x 器 一 mm) 上 矩阵 3， 使 得 每 个 形 如 : x, 二 By，yER” ”的 向 量 都 是 欠 定 方程 组 Ax=b 的 
一 个 解 ， 


31.5-1 设 MO 是 求 axn 甜 阵 的 姨 积 所 需 划 的 时 间 ，S(o) 表 示 求 nxn 卸 阵 的 六方 所 需 竖 的 时 间 。 证 
明 : 求 扎 阵 乘积 运算 与 求 失 阵 绊 方 运算 实质 上 难 讶 相同 : Sm= GUIM(n))。 

31.5-2 庶 Mn) 基 求 axn 比 阵 的 乘积 所 需要 的 时 间 ,， Ltnm) 为 求 一 个 nxn 和 失 阵 的 LUP 分 解 所 需要 的 
时 间 。 证 明 求 抵 中 乘积 与 计算 算 阵 的 LU 分 解 实质 上 难度 相 问 LOD7= 包 [MICny。 

31.5-3 设 Mo) 是 求 mxn 矩阵 的 乘积 所 需 杰 的 时 间 ，D(m 才 示 求 nxn 和 邱 阵 的 行列 式 的 值 所 需要 的 时 
间 . 证 明 求 行列 起 的 值 不 比 求 矩阵 乘积 更 困难 : DJ= OKMI(n). 

31.5-4 设 M(m 是 求 mxan 布尔 矩阵 的 好 积 所 需 覆 的 时 间 ，T(m) 为 找 出 nxna 布尔 所 阵 的 传递 半 包 所 需 
要 的 寻 间 。 斌 明 : MIm= OfTCnD，T(=OUMCnlgn)。 

31.5-5$ 当 绝 阵 元 素 属于 整数 模 2 所 构成 的 坡 时 ， 基 于 定理 31.12 的 求 首先 阵 算 法 是 天 能 够 运行 ? 试 解 
释 其 原因 。 

31.5$-6*+ ”推广 基于 定理 31.12 的 求 道 符 阵 算法 忆 之 能 处 理 复 算 阵 的 铺 形 ， 并 证 明 所 给 出 的 推广 方法 是 
正确 的 。( 提 示 : 用 A 的 共 辑 转 置 矩阵 A "来 代替 A 的 转 图 矩阵 AI， 把 AT- 中 每 个 元 素 用 其 共 斩 复 数 来 取 
代 就 得 到 A"*。 考 虑 用 Hernmnitian 矩阵 来 代替 对 黎 和 矩阵 ， 所 谓 Henmitian 矩阵 就 是 满足 点 = 和 的 由 阵 入 。) 
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31.6 一 1 证明: 对 称 正 定 给 阵 的 对 角 线 上 的 每 一 个 元 素 都 为 正 值 . 
b 
31.6 一 2 设 -| “| x2 的 对 称 正 宪 矩 阵 。 运 用 引 理 31.15 的 证 明 过 程 中 用 过 的 “完全 
忆 


半 方 * 来 证 极其 行列 式 的 值 ac 一 b ”是正 的 . 
34.6 一 3 证 明 :-- 个 对 称 正 定 矩阵 中 值 最 大 的 元 素 处 于 其 对 角 线 上 。 
31.6 一 4 证明: -个 对 称 正定 振 阵 的 每 一 个 主子 抑 阵 的 行列 式 的 值 均 是 正 的 ， 
316-5 设 A 表 对 称 正 定 上 矩阵 A 的 第 上 个 主子 和 矩阵。 证 明 在 LU 分 解 中 ，det(A)7 det(A ，) 
是 第 个 二 元 ， 为 方便 起 见 设 dtAwJ 一 1 
31.6--6 找 出 形 如 Flx)=c, +c,xlgx+ce 的 函数 ， 使 其 为 下 列 数据 点 的 最 优 最 小 二 乘 拟 
全: 〔〈1，H，、(2，1，(3，3)，(4，8) 
316 一 了 证 明 : 伪 递 持 阵 上 ”满足 下 列 四 个 等 式 : 
和 AAA 不 一 由 
AAA 和 ”一 和 
(AAA 一 站 谍 
(AAA) 一 入 ”入 
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第 三 十 二 章 ”多 项 式 与 快速 仿 里 叶 变 换 


两 个 m 次 多 项 式 相 加 所 需 的 时 间 为 纪 n)， 相 乘 所 需 的 时 间 为 日 (n 涩 。 在 本 章 中 ， 我 们 将 
论述 快速 情 里 时 变换 (Fast Fourier Transform， FET) 方 法 是 如 何 使 多 项 式 相 乘 的 运行 时 间 恋 
为 @@tn it 的. 


多 项 式 


在 一 个 代数 城下 上 ， 关于 变量 x 的 多 项 式 定 义 为 按 如 下 方式 表示 的 函数 AGo: 
和 (XI) 一 间 ai X 


n 为 该 多 项 式 的 次 数 界 ， 值 aa，aij，…，a _| 为 多 项 式 的 系数 。 所 有 系数 均 属于 域 下 ， 典 型 
的 情况 是 复数 集合 C。 如 果 一 个 多 项 式 A(o) 的 最 高 次 的 非 鹤 系数 为 aa， 我 们 就 说 ACo 的 次 
数 是 k， 次数 范围 为 习 的 和 多项式， 其 次 数 可 以 是 0 到 nl 间 的 任何 整数 ， 了 世 包 括 立 禄 an 一 1 
在 内 。 反 过 来 说 ， 对 任意 n>k， 一 个 k 次 多 项 式 也 是 一 个 次 数 范 围 为 n 的 多 项 式 。 

下 面 对 多 项 式 定义 各 种 相应 的 运算 。 

对 多 项 式 加 法 ， 如 果 A(xo) 和 BO 是 次 数 范围 为 an 的 多 项 式 ， 那 么 它们 的 和 也 是 一 个 次 
数 范围 为 n 的 多 项 式 CCo)， 并 满足 对 所 有 属于 定义 域 的 x 都 有 COO 一 AGO+BCO。 即 ， 如 时 


A(g 一 之 ai 
着 且 加 
Bt(x) 一 Zex 
则 加 
Clx) = Zex AN 
其 中 cj =a +b，j=0，1，…， 一 1。 例 如， 如 果 AGO 一 bx +7x 一 10x 二 9，BGOO 一 


一 2 十 4 牧 一 9， 则 CN 一 4 二 TX 全 十 4 

对 多 项 式 乘 法 ， 如 果 A(x) 和 B(x) 都 是 次 数 界 为 了 的 多 项 式 ， 则 说 它们 的 积 是 一 个 次 数 
界 为 2n -1 的 多 卡 式 Co0， 并 满足 对 所 有 属于 定义 域 的 x， 都 有 Clx] = AGOB(oJ。 读 者 以 
前 可 能 也 学 过 多 项 臣 乘 法 ， 其 方法 是 把 A(z) 中 的 每 一 项 与 B(x) 中 的 每 一 一 项 相 乘 然后 再 把 同 
类 项 合并 。 例 如 ， 我 们 可 以 按 如 下 方式 对 两 个 多 项 式 AC9 = 6rx +7x 一 10k+9 和 BOx)= 
-2x +4 和 一 5 进行 乘法 运算 : 


一 530- 一 


6x3 二 37x- Or 二 9 
一 2x3 十 4- 5 


一 30x3 -~- 3Sxz 十 50vr -45 
24x4 十 28x3 一 40x2 十 36 
一 12xe 一 14x3 十 20x4 一 18xy3 


-12xe -14x5 十 44x4 -20x3 ~- 752 二 86 -45 


必 -一 种 表示 积 Cfe) 的 方法 是 
CO= 工 cx (32.1) 
其 中 
c =- >ab ， (32.2) 


注意 ，degree(C) = degree(A)+detree(B) 理 合 
degree-bound(tC) =degree 一 bound(A)Hdegreebound(B) 一 ] 
所 degree 一 bound(A)+Hdrgree--bound(B) 
得 是 我 们 不 说 C 的 次 数 界 为 A 的 次 数 界 与 吾 的 次 数 界 的 和 ， 这 是 因 为 媳 果 一 个 多 项 式 的 次 
数 界 为 k， 则 我 们 也 可 以 说 该 多 项 式 的 次 数 界 为 k+1， 


本 章 概 述 


32.1 节 靖 述 了 丙种 表示 多 项 式 的 方法 : 系数 表示 法 和 点 值 表示 法 。 当 用 系数 表示 法 点 
尔 多 融 式 时 ， 关 于 多 项 式 乘法 的 简单 算法 ( 式 (32.1) 和 (32.2)) 所 需 的 运行 时 间 为 @@(n， 介 采 
用 点 值 表示 法 其 运行 时 间 仅 为 @(m。 不 过 ， 通 过 对 这 两 种 表示 法 进行 转换 ， 采用 系数 表示 
法 米 求 商 个 多 项 式 的 积 林 以 使 运行 时 间 变 为 @n lg D)。 为 了 霸 铺 这 种 方法 为 什么 可 行 ， 我 
们 将 在 32.2 节 中 学 习 单位 元 素 的 复 根 。 然 后 我 们 运用 FFT 和 32.2 节 中 描述 的 它 的 反 执行 
上 述 转 换 。32.3 节 论 述 了 如 何在 串 行 模型 与 并 行 模型 上 尽快 地 实现 FFT. 

本 章 中 大 量 地 用 到 了 复数 ， 符 号 i 专用 于 表示 忆 二 工 . 


32.1 多项式 的 表示 


花茶 种 意义 上 说 ， 多 项 式 的 系数 表示 法 与 点 值 表示 法 是 等 价 的 ， 即 用 点 值 形式 表示 的 多 
项 式 都 对 应 一 个 系数 形式 的 多 项 式 。 在 本 节 中 ， 我 们 将 介绍 这 两 种 表示 方法 , 并 阐述 如 何 把 
这 两 种 表示 结合 起 来 ， 从 而 使 两 个 次 数 界 为 n 的 多 项 式 乘法 运算 在 Btn ie 上 的 时 间 内 完成 . 


系数 表示 法 


一 个 次 数 范围 为 n 的 多 项 式 A(o 一 开 aixi 的 系数 表示 法 就 是 一 个 由 系数 组 成 的 向 蚀 


a= (ao，al，…，an_)。 在 本 章 所 涉及 的 矩阵 方程 中 ， 我 们 一 般 把 它 作 为 列 向 量 进行 处 理 ， 
采用 系数 表示 法 对 于 某 些 关 于 多 项 式 的 运算 是 很 方便 的 。 例 如 ， 对 多 项 式 A(x) 在 某 个 
给 定点 xo 的 求 值 运算 就 是 计算 A(xo) 的 值 。 如 果 使 用 霍 纳 法 则 (Horners rule)， 则 求 值 运算 


一 -dd 人 -一 


的 运行 时 间 为 包 (nj: 
A(xoj= ao+xofai 十 xno(ai 十 … 十 Xofa _ :二 Xofa， 访 … _ 

类 似 地 ， 对 两 个 分 别 用 系数 向 量 a= (ao，8，…，a 1) 和 hb=(bi，bi，…，b 1) 表 示 的 
多 项 式 进行 相 加 所 需 的 时 间 是 @n): 仅 输出 系数 向 量 clco，ci，…，co 小 其 中 对 j=0，1， 
…，nr1、 有 =arHb， 

现在 我 们 来 考虑 两 个 用 系数 形式 表示 的 次 数 界 为 mn 的 多 项 式 A(CoO 和 BO 的 乘法 运算 ， 
如 旦 我 们 用 起 (32.1 与 (32.2) 所 描述 的 方法 ， 完 成 多 项 式 乘法 所 需要 的 时 间 就 是 @(n 涩 ， 因 为 
向 量 a 中 的 每 个 系数 必须 与 向 量 b 中 的 每 个 系数 相 乘 。 用 系数 形式 表示 的 多 项 式 乘法 运算 
似乎 要 比 求 多 项 式 的 值 移 项 式 加 法 困难 得 冤 。 由 式 (32. 信 给 出 的 结果 系数 向 量 c 也 称 为 输 - 
六 回 量 a 和 bb 的 卷 积 ， 表 示威 e= acob。 因 为 多 项 式 乘 法 与 卷 积 的 计算 都 是 最 基本 的 计算 问 
题 . 在 实 跨 中 非常 重要 , 所 以 本 章 将 重点 讨论 有 关 的 高 效 算 法 。 


点 值 囊 示 法 


一 个 次 数 界 为 mn 的 多 项 式 A(x) 的 点 值 表示 就 是 n 个 点 值 对 所 组 成 的 集合 : 
1C0，70，(C0，yD， 人 Co 轧 - 半 
其 中 所 有 和 各 不 相同 , 并 且 对 k = 0，1，…，pn-1 有 
办 一 AAA(xt) (32.3) 
一 个 多 项 式 可 以 有 很 多 不 同 的 点 值 表示 ， 这 是 由 于 任意 n 个 相 异 点 xz，，…，x ;组 成 的 
集合 都 可 以 作为 这 种 表示 法 的 基础 。 

对 于 一 个 用 系数 形式 表示 的 多 项 式 来 说 ， 在 原则 上 计算 其 点 值 表示 是 简单 易 行 的 , 因为 
我 们 所 要 做 的 就 是 选取 na 个 相 异 点 x，x，…，x ,， 然 后 对 区 =0，1，…，m1， 求 出 
A(xu) 的 值 。 使 用 起 纳 法 则 ， 求 出 这 nm 个 点 的 值 所 需要 时 间 为 @(n39)。 在 稍 后 我 们 将 看 到 如 果 
巧妙 地 选取 习 ， 就 可 以 加 速 这 一 计算 过 程 ， 使 其 运行 时 间 变 为 Btn lgm)， 

求 值 运行 的 逆 运 算 ( 从 一 个 多 项 式 的 点 值 表示 确定 其 系数 表示 中 系数 ) 称 为 播 值 。 下 列 定 
理 说 明 捅 值 具 有 完备 的 定义 ， 假 设 揪 信 多 项 式 的 次 数 范围 等 于 已 知 的 点 值 对 的 数目 。 

定理 32.1( 多 项 式 插值 的 唯一 性 ) 对 于 任意 n 个 点 值 对 组 成 的 集合 {(xs，yY)，(Go，y)， 
(x_i yi 讨 ， 存 在 唯一 的 次 数 界 为 习 的 多 项 式 A(zt 满足 而 =A(Gx)，KX=0，1，… 
了 一 | 


证 明 : 证 明 过 程 的 基础 是 某 个 矩阵 存在 道 答 阵 ， 式 (32.3) 等 价 于 矩阵 方 各 


】 Xo Xn 心 
ao yn 
1 和 KK 0 
， &1 一 了 ， {32.4 
了 n-- au-1 yn 
】 X 1 Xu _1 xu-1 
左边 的 抢 阵 为 范 德 蓝 和 矩阵， 表示 为 V(xz,，x,，…，x，,)。 根 据 练习 31.1 -- 10， 该 矩 
阵 的 行列 式 的 值 为 


j<k 


[Le 一 x) 
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因此 . 由 定理 31.5 可 舌 ， 如 果 x， 相 异 ， 则 该 矩阵 是 可 求 着 的 { 即 非 奇 异 的 )。 因 此 ， 
寺 给 定 的 唯 -的 点 俩 表示 ， 我 们 能 够 求 出 系数 a 的 解 : 
a=VG xy 
定理 32.1 的 证 明 过 程 风 时 描述 了 基于 求解 式 (32.4 中 的 线性 方程 组 的 一 种 插值 算法 。 使 
用 第 := 十 一 章 中 讨论 的 LU 分 解 算法 ， 我 们 可 以 在 (na) 的 运行 时 间 内 求 出 该 线性 方程 组 的 
解 ， 
对 mn 个 点 进行 插值 的 另 个 一 种 更 快 的 算法 是 基于 下 列 拉 桥 设 日 (Lagrange) 公 式 : 


na-1 Te 一 35) 
AI = 2 7 -一 一 (32.3) 
长 一 和 TIG 一 x) 


让 者 也 许 希 望 验证 等 式 (32.5) 的 右 端 是 一 个 次 数 荡 围 为 n 的 多项式 ， 并 满足 对 所 有 K， 
Atxt)=yke， 练 习 32. 1 将 要 求 读者 说 明 如 何在 昌 (n3 的 运行 时 间 内 运用 拉 格 朗 上 日 公式 计算 
出 A 的 所 有 系数 。 

因此 ， ， 个 点 的 求人 运算 与 揪 信 运算 是 有 完备 定义 的 互 逆 运 算 ， 运 用 这 两 种 运算 就 可 以 
把 多 项 式 的 系数 表示 与 其 点 值 表示 相互 进行 转化 。 关 于 这 些 问 题 的 上 述 算法 的 运行 时 间 为 
已 (0 )， 

点 值 表示 法 对 许多 关于 多 项 式 的 操作 是 很 方便 的 。 对 于 加 法 ， 如 果 COD=A(x)HB(x)， 
则 对 任意 点 x ， 有 CDJ= A(xu)+B(xJ)。 更 精确 地 说 ， 如 果 我 们 已 知 A 的 点 值 表示 : 

[0、yo0，(C， hh， Co yn_1 寺 
和 帅 的 点 值 表 小 : 
(xy 人， (xn Y -1 过 
(注意 、A 和 B 对 相同 的 nm 个 点 进行 求 值 ) 则 C 的 点 值 表 示 为 
1LXo。 YoTyY (xl yi 十 Y )， 四 (xn yo +HY 
因此 . 对 两 个 点 值 形 式 表示 的 次 数 界 为 的 多 项 式 相 加 ， 所 需 时 间 为 昌 (D)。 

类 似 地 ， 点 值 表 示 法 对 于 多 项 式 乘法 也 是 很 方便 的 。 如 果 CC =AGCoOB(， 则 对 任意 点 
x ， 有 CCxDJ= Atxu)B(x)， 并 且 我 们 可 以 把 A 的 点 值 表示 点 乘 B 的 点 值 表 示 , 就 可 以 获得 C 
的 点 值 疼 未。 不 过 ， 我 们 也 必须 面 对 这 样 一 个 问题 ， 即 C 的 次 数 界 是 A 的 次 数 界 与 也 的 次 
数 界 的 种。A 和 B 的 标准 点 值 表示 法 是 由 每 个 多 项 式 的 工 个 点 值 对 所 组 成 。 把 这 些 点 值 对 
相 乘 ， 我 们 就 得 到 C 的 na 个 点 值 对 ， 但 是 由 于 C 的 次 数 界 为 2n， 直 定理 32.1 可 知 , 要 获得 
C 的 点 值 表示 需要 2n 个 点 值 对 。 因 此 ， 我 们 必须 对 和 和 了 的 点 值 表示 进行 < 扩充 ", 使 每 个 
多 项 式 都 包含 2n 个 点 值 对 。 如 果 已 知 A 的 扩充 点 值 表示 : 

Lo，yn，( 人 xy， 人， (Cn yz 
和 日 的 相 庶 扩 充 点 值 表 示 : 
txo，Y 《Xi YU，…， (xn-， Y 2 外 
则 有 的 点 倡 表 未 为 : 
[Yoy Cn，yYIY (Ca yzn_1yY 2 
中 时 给 定 两 个 扩充 志 信 形式 的 输入 多 项 从， 我 们 就 会 看 到 ， 使 其 相 乘 从 而 得 到 结果 的 点 
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值 形式 所 需要 的 运行 时 间 为 @(n)， 这 要 比 采 用 系数 形式 的 两 个 多 项 式 相 乘 所 需 的 时 间 要 少 
得 多 。. 

最 后 ， 我 们 来 者 虑 对 一 个 点 值 表示 的 老 项 式 ， 如 何 求 其 在 某 新 的 点 的 值 。 对 这 个 问题 来 
说 ， 显 然 最 简单 不 过 的 方法 就 是 先 把 该 多 项 式 转化 为 其 系数 形式 ， 然 后 再 求 其 在 新 点 的 值 。 


关于 系数 形式 表示 的 多 项 式 的 快速 熏 法 


能 否 利用 关于 点 值 形式 表示 的 多 项 式 的 线性 时 间 乘 法 方法 , 来 加 快 系数 形式 表示 的 老 项 
式 来 法 运算 的 速度 呢 ? 答 案 依 赖 于 能 否 快速 把 一 个 多 项 式 从 系数 形式 转化 为 点 值 形式 ( 求 什 》 
或 从 点 值 形式 转化 为 系数 形式 (插值 )。 : 

我 们 可 以 用 我 们 需要 的 任何 点 作为 求 值 点 ， 但 通过 精心 地 挑选 求 值 点 ， 我 们 可 以 把 两 种 . 
表示 法 之 加 的 转化 所 需 的 时 间 压 缩 为 Btn lg m)。 如 我 们 将 在 32.2 节 看 到 的 那样 ， 如 果 我 们 
选择 “单位 元 素 的 复 根 * 作 为 求 值 点 ， 则 通过 对 对 数 向 量 进 离散 傅 里 叶 变 换 ， 或 DET， 从 前 
得 到 相应 的 点 值 表示 。 我 们 同样 也 可 以 通过 对 点 值 对 执行 “* 道 DFT" 运 算 而 获得 相应 的 系数 
问 量 ， 这 样 就 完成 了 求 值 运算 的 道 运算 一 -- 揪 值 。 第 32.2 节 将 说 明 FFT 如 何在 日 (na lg m) 的 
时 间 内 执行 DFT 和 道 DEFT 运算 。 

图 32.1 用 赂 的 方式 说 明了 这 种 策略 , 其 中 涉及 了 次 数 界 问题 。 两 个 次 数 界 为 的 多 项 式 
的 积 是 一 个 次 数 界 为 2n 的 多 项 式 。 久 此， 在 对 输 人 多 项 式 A 和 B 进行 求 伸 运算 之 前 ， 我 们 
间 先 通过 增加 nm 个 值 为 0 的 高 阶 系数 使 其 次 数 界 增加 到 2n。 因 为 向 量 包含 2n 个 元 素 ， 所 以 
我 们 用 到 了 “单位 元 素 的 2n 次 复 相 ” 空 看 图 "?.1 中 册 项 w， 表示 。 
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图 32.1 一 种 石 训 的 多 虎 式 习 法 过 程 的 图 示 


如 果 已 知 FFT， 我 们 就 有 下 列 运行 时 间 为 @tn lg mn) 的 过 程 ， 该 过 程 把 两 个 次 数 界 为 
的 多 项 式 A(xz) 和 B(x) 进 行 乘 法 运算 ， 其 中 输入 与 输出 均 采 用 系数 表示 法 。 我 们 假定 mn 为 2 
的 震 ， 通 过 加 人 适当 值 为 0 的 高 阶 系数 ， 这 个 要 求 总 能 被 满足 
1. 使 次 数 界 增加 一 倍 : 通过 加 和 人 nm 个 值 为 0 的 高 阶 系 数 ， 把 多 项 式 AcO 和 B(x) 扩 充 为 
次 数 界 为 2n 的 多 项 式 并 构造 其 系数 表示 。 
2. 求 值 : 两 次 应 用 2n 阶 的 FEFT 计算 出 ACoO 和 B(x) 的 长 度 为 2n 的 点 值 表 示 。 这 两 个 
点 值 表示 中 包含 了 两 个 多 项 式 在 单位 元 素 的 2n 次 根 处 的 值 
3. 点 滋 : 把 A(o 的 值 与 BC 的 值 按 点 相 乘 ， 就 可 以 计算 出 多 项 式 CGO=AGOBGo 的 点 
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值 表 未 。 这 个 表示 中 包含 了 (9 在 单位 元 素 的 每 个 2 如 次 根 处 的 值 。 

4. 插值 : 只 要 对 2n 个 点 值 对 应用 一 次 FFT 以 计算 出 其 道 DFT 就 可 以 构造 出 允 项 式 
CO 的 系数 表示 。 

执行 第 1 步 和 第 3 步 所 需 时 间 为 B(n)， 执 行 第 2 步 和 第 4 步 所 需 时 间 为 @(a 地 四。 因 
此 ， 一 只 我 们 说 明了 妇 何 运用 FFT， 我 们 就 已 经 证 明了 十 列 定理 。 

定理 32.2 ” 当 输 入 与 输出 都 采用 系数 形式 来 表示 多项式 时 ， 我 们 能 够 在 @n jg 由 的 时 
闻 内 计算 出 两 个 次 数 界 为 的 多 项 式 的 积 。 


32.2 DPT 与 FRT 


在 32. 节 中 ， 我 们 说 过 如 果 使 用 单位 元 素 的 复 根 ， 则 能 在 On lg 目的 时 间 内 成 求 值 与 
插值 运算 ， 在 本 节 中 ， 我 们 给 出 单位 元 素 的 复 根 的 定义 及 其 性 质 ， 定 义 DFT 并 说 明 FFT 
如 徊 仅 用 On lg 刁 的 时 间 就 可 以 计算 出 了 PET 与 它 的 逆 。 


单位 元 素 的 复 根 


单位 元 索 的 n 次 复 根 是 满足 凤 = 1 的 复数 w。 实 际 上 ， 单 位 元 素 的 n 次 复 根 有 了 个 ， 
它们 是 er 9 k=0，1.…，n-1。 为 了 解释 这 一 式 子 ， 我 们 利用 复数 的 医 的 定义 : 
eu 一 Cos(uyHisin(u} . 
图 32.2 说 明 单 位 抑 素 的 mn 个 复 根 均等 地 分 布 在 以 复 平 面 的 原点 为 圆心 的 单位 半径 的 图 
阅 上 。 值 
W 一 6 (32.6] 
了 称 为 单位 元 素 的 主 n 次 根 ， 单 位 元 索 的 所 有 其 他 nm 次 复 根 都 是 w。 的 其 。 





图 32.2 在 其 中 而 也 ws，、w,，…，w; 的 值 ， 其 中 w。 = e ”是 单位 元 的 主 8 次 祖 


革 位 元 索 的 个 n 次 复 根 w"，w,，…，w" 在 匀 法 运算 二 形成 一 个 群 ( 参见 33.3 
节 )。 该 群 的 结构 与 加 法 群 (Z. ，+) 模 n 相 则 ， 这 是 因为 w: = w。 = 说明 ww 一 w。 


=w'  "。 类 似 地 有 w，=w" 。 下 面 的 引 理 给 出 了 单位 元 素 的 n 次 复 根 的 重要 性 质 。 
引 理 32.3( 相 消 引 理 ) 对 任何 整数 mn 关 0，kz>0，d>1， 
-一 汪 44 一 一 


WwW 一 WwW (32.7) 


= (人 e” 


推论 32.4 ”对 任意 偶数 n > 0， 有 w'"” 一 w, = 一 二 
证 明 : 证 明 过 程 留 作 练 习 ( 见 练 习 32.2 一 1)。 


引 理 32.S( 折 半 引 理 ) 如 果 m>0 为 偶数， 单位 元 素 的 nm 个 nm 次 复 根 的 平方 等 于 单位 元 
素 的 az2 个 na72 次 复 根 。 


证 明 : 根据 相 消 引 理 ， 对 任意 非 负 整数 kx， 我 们 有 (wx)? = w'" ，。 注 意 ， 如 果 我 们 对 音 
位 元 秦 的 所 有 an 次 复 根 进行 了 方 实际 上 单位 元 索 的 每 个 ny 2 次 根 要 获得 两 次 ， 因 为 


(w。”) = 
一 wa 
一 (w 
因此 ，w+ 与 wi*%2 的 平方 值 相 同 。 这 条 性 质 也 可 以 由 推论 32.4 来 证 明 ， 因为 w" 
= 一 1 说 明 w ”= 一 Wi， 因此 (wii =(w9 


我 们 将 会 看 到 ， 折 半 引 理 对 于 运用 分 治 法 来 对 多 项 式 的 系数 与 点 值 表示 进行 相互 转换 是 
非常 重要 的 ， 这 是 因为 它 能 够 保证 递 籽 的 子 问 题 的 规模 是 递归 调用 前 的 一 半 。 
引 理 32.6( 求 各 引 理 ) 对 任意 整数 nz 关 1 和 不 能 被 nm 整除 的 非 负 整数 kK、 有 
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要 求 k 不 能 被 mn 整除 就 可 以 保证 分 母 不 为 0 因为 只 有 当 k 能 被 n 整 除 时 才 有 w'" = 1。 
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DFT 


辣 顾 一 下 我 们 项 旦 计算 次 数 界 为 a 的 多 项 式 
上 Go 一 4 X- 


必 


在 w"、wi，…，wa- 处 的 值 ( 即 在 单位 元 素 的 了 个 次 复 根 处 ) 。 不 失 一 般 人 性 ， 我 们 候 
定 n 是 2 的 短 ， 因 为 给 定 的 次 数 界 总 可 以 增 大 ， 

如 果 需 要 我 们 总 可 以 增加 值 为 9 的 新 的 高 阶 系数 。 我 们 假定 已 知 A 的 系数 形式 : a= 
ta ， ai，…a 1 对 天 =0，!1，…，nr1， 定 义 结果 y, 如 下 : 


肌 


y， 一 A(w 】 
= a (32.8) 
阿 最 y = (y,，y,，…，y，) 是 系数 向 量 a= (a,，a ，…，a ，) 的 离散 傅 里 时 变 


搞 (Discrete Fourier Tansfomm 的 DFT》), 也 写 作 y= DFT _(a)。 
FET 


通过 使 用 一 种 称 为 快速 傅 里 时 变换 (FFT) 的 方法 ， 我 们 就 可 以 在 @tn lg 名 的 时 间 内 计算 
出 DFT,al， 调 直接 的 方法 所 需 时 间 为 @(o0]。FFT 主要 是 利用 了 单位 元 素 的 复 根 的 特殊 性 
质 。 

FEFT 方法 运用 了 分 治 策略 ， 它 用 A( 中 侦 下 标的 系数 与 查 下 标的 系数 分 别 定义 了 两 个 
新 的 次 数 界 为 ny2 的 多 项 式 A O 和 和 Atoog: 


由 /2-1 
A、 (一 na 十 3 X 十 人 X 十 十 加 


AD 一 十 凡 ， X 十 旨 LI 十 … 十 有 1 


了 一 | 


注意 . A ”包含 A 中 所 有 倘 下 标的 系数 (下 标的 相应 二 进 制 数 的 最 后 一 位 为 0)， 
要 | 


而 A 包 富 和 中 所 有 言 下 标的 系数 (下 标 对 应 的 一 进 制 数 的 最 后 一 位 为 1。 所 以 有 下 式 


AU =A"x +TxA (3 (32.9) 
这 祥 . 求 A(x) 在 w"、 w ， - ww 处 的 值 的 问题 就 转化 为 : 
1. 求 次 数 界 为 nz 2 的 多 项 式 A"(x) 与 AU(O 在 点 
(人 (32.10) 
的 侦 ， 然 
>、. 根据 式 (32.9) 把 上 述 结 果 进 行 组 合 。 
根据 折 半 引 理 、 值 的 序列 (32 10) 并 不 是 由 了 个 不 则 的 值 组 成 的 ， 而 是 仅 由 单位 元 素 
的 nr2 个 nz 次 复 根 所 组 成 ， 每 个 根 均 出 现 两 次 。 因 此 次 数 界 为 n/2 的 多 项 式 AA 


和 人 A” 递 归 地 在 单位 元 素 的 ny2 个 n72 次 复 根 处 进行 求 值 。 这 些 子 问题 与 5 原始 问题 形式 
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衣 问 ， 候 规模 缩小 一 半 。 现 在 我 们 已 经 成 切 地 把 一 个 na 个 元 素 的 DFT, 计算 过 程 划分 为 两 
个 na7 2 个 五 素 的 DFT ,计算 过 程 。 这 一 分 解 是 下 列 递归 的 FFT 算法 的 基础 ， 该 算法 计 
算 几 一 个 直 0 个 二 索 组 成 的 向 量 a=(a，a ，…，a _ ) 的 DFT， 其 中 ma 是 2 的 寡 。 


RECURSTVE 一 FEFTCa) 
二 lenegth[a] An 是 2 的 符 
if nm 一 tt 
then Fetbrn 有 4 
mW m 


WwW 一] 


] 

了 

卫 

才 

5 

看 ae 一 (ta ， aa ，…， 了 站 )] 
7 aa 4 人 8， 
名 
印 
1 


要 nm 一 上 
一 RECURSIVE 一 FFT(am) 
y， RECURSIVE - FFT(a) 
for KeD to nrv2 一 1 
册 中 
11 do YY 人 YY 十 wy， 
们 ] TI 
1 3 
13 We 
14 return 了 公 假 说 y 为 列 问 量 


RECURSIVE-FFT 的 执行 过 程 如 下 。 第 2 一 3 行 代 表 递 归 的 基础 ; 一 个 元 吾 的 DFT 就 
旦 该 元 素 自 身 ， 因 为 在 这 种 情 癌 十 


_ 必 
yn0 一 anwW， 


第 6 一 7 行 定 了 多 项 式 A” 和 人 A ”的 系数 向 量 。 第 4，5 和 13 行 保证 可 以 对 w 进行 通 
当 的 更 新 . 以 便 每 当 第 11 -- 12 行 被 执行 时 ， 有 w = w: (在 一 次 次 欠 代 中 使 w 的 值 不 断 变化 
可 以 使 每 次 通过 for 循 征 计算 w* 时 减少 氛 除 值 的 时 间 )。 第 8 一 9 行 执行 了 递归 计 
齐 DFT，, 的 过 程 。 对 KK=0，1，…，n72 一 1， 车 : 


ye =A (wj) 
人 Ac 

或 者 ,根据 相 消 引 理 有 w- ,= w…， 有 : 
y' _ A(w2) 


y， 一 AI(w] 


第 11 - 12 行 把 递归 计算 DFT ， 记得 的 结果 进行 组 合 。 对 y ,y ，… 交 第 11 行 得 到 


zz 一 1? 


员 k | 
3 一 十 Woy 


一 34 一 


问 


一 A (w， ) 十 WA (w ) 
一 Atw ) 四 . 
其 中 最 后 一 行 是 根据 式 (32.9) 推 得 的 对 了 ，，y ，，…，y _  ， 设 k 
=0，!，…，n7Z2 一 1， 执行 第 12 行 得 到 : 
了 kaza 一 罗 一 w， 
一 y8 十 Wi 人 
一 AT (mw ) 十 WA (ww7] 
=Av (ww AD(w2 


_ A(w 


因为 w ”= 一 ， 所 以 第 二 行 成 立 。 第 四 行 是 从 第 三 行 推 得 的 ， 因 为 w" = 1, 说 


明 w”* = w”“"。 最 后 一 行 是 根据 式 (32.9) 推 得 的 。 因 此 ， 由 过 程 RECURSIVE 一 FFT 所 
返回 的 问 量 y 确实 是 输入 向量 a 的 DET.。 
为 了 确定 过 程 RECURSIVE -~ FFT 的 运行 时 间 ， 注 意 除了 递归 调用 外 ， 每 条 命令 执行 
所 禹 的 时 间 为 上 (nn)，n 为 输入 向 量 的 长 度 。 因 此 , 关于 运行 时 间 有 下列 递归 式 : 
T( mm =2Tny7 力 十 外 0 癌 ) 
一 人 nign) 
因此 ， 运 用 快速 傅 里 叶 变 换 ， 我 们 就 可 以 在 Btn LE 目的 时 间 内 求 出 次 数 界 为 mn 的 多 项 
式 在 单位 元 素 的 nm 次 复 根 处 的 值 。 


对 单位 元 素 的 复 根 进行 插值 


现在 我 们 说 明 如 何在 单位 元 素 的 复 根 处 进行 插值 ， 以 便 把 一 个 多 项 式 从 点 值 表示 转化 为 
系数 表示 . 从 而 完成 多 项 式 乘 法 方案 。 我 们 按 如 下 方式 进行 插值 : 把 DFT 写成 一 个 矩阵 方 
程 ， 然 后 再 检查 其 逆 矩 阵 的 形式 。 

根据 式 (32.4)》， 我 们 可 以 把 DFT 写成 矩阵 积 y= Va， 其 中 V,。 是 由 w, 的 适当 宪 组 成 的 
一 个 范 德 蒙 矩阵 : 


yn an 
1] 环 W 凤 ” " 

也 也 也 也 已 王 | 
1 袜 哩 如 am 一 刁 

了 3 Win WwW WwW 站 
3 日 儿 3 一 沁 

y) 1 WwW W WwW ” 包 

nm 口 且 妃 了 

: 有 
n 一 ] 2 一 1 3 一] 一 La 一 全 
ya-1 1 台 ， W， 本 人 au 


对 j， k= 0，1，…，n 一 1，V。 的 (k，j 处 的 元 素 为 ws， 并 且 V, 中 元 素 的 靠 形成 一 
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张 乘法 运 答 表 ， 
对 于 逆 运 等 a = DFT ，(y)， 我 们 通过 把 y 乘 以 逆 矩 阵 V 来 进行 处 理 。 
定理 32.7 对 j、 才 = 0，1，…，n 一 1，V， 中 G， 区 处 的 元 素 为 w -5 v ms。 
证 明 : 我 们 证 明 V。YV,。= 贡 ( 即 nx 单位 矩阵 )。 考 察 V，V。 中 的 元 素 6， 认 : 


[v，V,] ,= 8 (w vam(ws) 


业 = 性 


一 
kf 中 一 说 
一 袜 w An 


- 如果 j =j。、 则 和 式 的 值 为 1， 由 求 和 引 理 { 引 理 32.6) 可 知 在 其 他 情况 下 和 式 的 值 
为 0， 祝 意 ， 我 们 依 束 了 于 一 凹 一 D<j 一 j<na 一 1 以便] 一 j 不 能 被 mn 整除， 这 样 才能 应 用 
求 和 疆 | 理 ， 


在 求 出 道上 矩阵 V， 后，DET (9) 可 由 下 式 给 出 ， 


与 


a = 上 yw ] 一 0，1，…，Dn 一] (32.1 功 

通过 比较 式 (32.8) 与 式 (32.11)， 我 们 发 现 通 过 对 FFT 算法 进行 如 下 修改 : 把 a 与 y 的 
作 才 开 换 ， 用 w。 来 代替 w,， 并 且 将 每 个 结果 元 素 除 以 na， 就 可 以 计算 出 着 DFT( 参见 练 
避 32.2 一 和 。 因 此 ， 我 们 同样 可 以 在 @(nlgn) 的 时 间 内 计算 出 DFT ”。 

因此 、 通 过 运用 FFT 与 道 FFT， 我 们 可 以 在 @Cnlgn) 的 时 间 内 把 次 数 界 为 ma 的 多项式 
六 其 系数 表示 与 点 值 表示 之 间 来 回 进行 转换 。 这 样 ， 在 失 阵 乘法 的 前 担 下， 我 们 已 证 明了 
下 列 结 论 ， 

定理 32.8& 卷 积 定理 ) 对 任意 两 个 长 度 为 n 的 向 量 a 和 b， 其 中 n 是 2 的 宕 ， 

a@b=DFT，(DFT,， (0 . DFT， (b) 
其 中 国 量 a 和 b 用 0 和 元素 使 其 扩充 到 长 度 为 2n, 表示 两 个 由 2n 个 元 素 组 成 的 向 量 的 
乘积 。 


32.3 有 效 的 FFT 实现 方法 


让 于 DFT 的 实际 庶 用 ， 如 信号 处 理 ， 需 要 极 高 的 速度 ， 所 以 本 节 将 讨论 两 种 有 效 的 
FFT 实现 方法 。 首 先 ， 我 们 讨论 一 种 运行 时 间 为 @tn lg 冲 的 FFT 算法 的 选 代 实 现 方法 ， 不 
过 其 运行 时 间 的 日 记号 中 隐 含 的 常数 要 比 32.2 节 中 论述 的 递归 实现 方法 中 的 常数 要 小 。 然 
后 ， 我 们 将 深入 分 析 选 代 实现 方法 . 设计 出 一 个 有 效 的 并 行 FFT 电路 . 


FEFT 的 一 种 和 迭代 实现 
我 们 首先 注意 到 ， 过 程 RECURSIVE-FFT 中 第 10-13 行 的 循环 中 两 次 计算 了 
值 wy，。 在 编译 术语 中 ， 该 值 称 为 公用 子 表达 式 。 我 们 可 以 改变 循环 使 其 仅 计 算 一 次 ， 并 
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把 它 存 故 在 临时 变量 { 中 。 
for ke0 to nz2 一 | 
入 和 te wy 
四 | 
yy 十 上 
避 | 
ys 


可 


这 个 循环 中 的 操作 : 把 w( 等 于 w5) 乘 以 y 中 ， 把 所 得 的 积存 人 + 中 ， 然 后 从 y” 中 卉 
加 t 和 了 减 t， 被 称 为 一 个 蝴蝶 操作 ， 图 32.3 说 明了 其 执行 步骤 。 


站 [ 引 
六 璋 十 of 隐 






革 
由 -OA 一 -一 





图 32.4 ”过程 RECURSIVE-FEPFT 的 递 灯 调用 产生 的 输 人 了 向量 树 


我 们 现在 来 说 明 如 何 使 FFT 采用 选 代 结 构 而 不 是 递归 结构 。 在 图 32.4 中 ， 对 树 形 结构 
的 每 次 对 RECURSIVE-FRFT 的 调用 请 求 ， 我 们 都 注 明 了 相应 递归 调用 的 输 人 人 向量， 在 初 
始 调用 时 有 mn=8。 树 中 的 每 -- 个 结 点 相应 于 每 次 对 过 程 的 调用 ， 由 对 应 的 输入 向 量 进 行 标 
记 。 每 次 调用 玉 ECURSIVE-FEFT 都 同时 产生 两 个 递归 调用 ， 除 非 该 过 程 接受 到 了 1 个 元 
素 组 成 的 向 量 。 我 们 把 其 第 -- 次 调用 作为 左 子 女 ， 第 二 次 调用 作为 右 子 立 。 

在 对 树 进 行 观察 时 ， 我 们 注意 到 如 果 我 们 把 初始 向 量 a 中 的 元 素 按 其 在 叶 结 点 中 出 现 的 
次 序 进行 排列 ， 我 们 就 可 以 对 过 程 RECURSIVE-EFFT 的 执行 过 程 模 所 如 下 。 首 先 ， 我 们 
按 对 来 取出 元 素 ， 运 用 一 次 里 蝶 操 作 计 算出 每 对 的 DFT， 并 且 肌 其 DFT 来 取代 该 对 元 
素 ， 这 样 沿 量 中 就 包含 了 ny 2 个 两 个 元 素 的 FFT。 下-- 步 ， 我 们 按 对 取出 这 ny 2 个 
DFT， 遂 过 执行 两 次 蝴 曙 探 作 计算 出 四 个 向 量 元 素 的 DEFT， 并 用 这 四 个 元 素 的 DEFT 取代 
相对 应 的 两 个 一 元 素 的 DFT， 于 是 向 量 中 包含 了 mn 4 个 4 个 元 素 的 DEFT。 我 们 继续 进行 
这 一 过 程 直 至 向 量 包含 两 个 n7 2 个 元 素 的 DFT， 我们 再 使 用 ny7 2 次 蝴蝶 操作 就 可 以 把 它 
们 组 合成 最 终 的 mn 个 元 素 的 DFT。 

为 了 把 这 一 观察 到 的 结果 变 为 代码 ， 我 们 采用 了 使 用 数组 A[0..-1}j。 官 始 时 该 数组 包 合 
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输 人 向 量 a 中 的 元 索 ， 其 顺序 为 它们 在 图 32.4 中 的 桂 的 叶 结 点 出 现 的 顺序 (我 们 在 后 面 将 说 

明 如 何 确定 这 个 顺序 )， 因 为 在 树 的 每 一 层 都 要 进行 组 合 ， 所 以 我 们 引入 一 个 变量 s 以 计算 

树 的 层 侈 ， 其 取 值 范围 为 从 !( 在 最 底层 ， 这 时 我 们 要 形成 的 是 两 个 元 素 的 DFT) 到 18 a( 在 最 

机 这 时 我 们 要 对 两 个 n72 个 元 束 的 DFT 进行 组 合 以 产生 最 后 结果 )。 因 此 , 该 算法 有 
下 结构 : 


] fors=<-1to 志 ta 
2 do fork< 情 tn 一 by 了 
了 do 把 在 站 [kkH2 一 和 各 EkH+2 .kt+21] 中 的 两 个 
2 1 个 元 素 的 DFT 组 全 成 一 个 在 A 站 .4k+2-1] 中 的 关 个 元 索 的 DFT. 


第 3 行 中 的 循环 体 可 以 用 更 详细 的 伪 代 码 来 描述 。 我们 从 过 程 及 ECURSIVE-EFEFT 中 
复制 for 循环 ， 使 y 四 与 AIk..k+22 一 相 一 致 ， 史 与 A[k+251..k+2: 一 U] 相 一 致 。 在 每 次 虹 暗 
操作 中 用 到 的 w 值 依赖 于 s 的 值 : 我 们 使 用 ww ， 其 中 辐 =2( 我 们 引 人 蛮 量 严 仅 为 了 使 代 
码 易 读 )。 我 们 勾引 入 另 一 个 临时 变量 ua, 以 便 能 在 适当 位 置 上 执行 蝴 昱 操作 。 当 用 循环 体 来 
取代 第 3 行 的 整个 结构 时 ， 就 得 到 下 列 伪 代码 ， 它 是 我 们 最 终 的 忱 代 开 FET 的 基础 ， 也 是 我 
们 今后 将 要 讨 伦 的 并 行 实现 的 基础 。 


FFT--BASELa) 1 ne 一 length[al 上 mn 是 2 的 入 
3 fors< to] 可 上 
3 性 mms 于 
二 WA<- 亡 2 和 
5 for k< 六 tn 一] by mm 
夏 do ws 1 
7 了 foerjim-0to my 2 一 ] 
8 do ts-w 二 [kk+jiHm 7 3] 
乡 ur -各 [krHi] 
10 各 [Hi]= 一 ut 
1 [KTHiHm 7 了 引 0 环 
12 WA 


现在 来 分 析 和 迷人 代 FFT 算法 的 最 后 代码 ， 访 代码 把 两 个 内 循环 的 次 序 进行 了 站 倒 以 消除 
对 革 些 下 标的 计算 ， 它 达 利 用 了 辅助 过 程 BIT--REVERSE 一 COPY(a，A), 以 便 把 向 量 a 按 
我 们 害 鉴 的 初始 烦 序 复制 到 数组 和 中 。 


ITERATIVE -FFTLa) 
1 BIT--REVERSE 一 人 COPYIR， 和 可) 
2 me lengthfaj 改 n 是 2 的 等 
3 ftorss- 1] tolgn 
ip Ta 了 

WwW， 上 2 ”Im 

Was 1 

for jn0tomy 2 一 | 

do focrks-~j to mn 一 ] by m 
io tn 一 ww 和 [KAI 2] 


怕 肥 -对 nm 条 
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1 u< :二 攻 ] 


11 点 E]= ut 
12 各 [k-Hm 7 2 ut 
1 WA 


14 “ceturnm 息 


过 程 BIT-REVERSE-COPY 是 怎 祥 把 输入 向 量 a 中 的 元 素 按 我 们 要 求 的 顺序 放 人 数 
给 A 的 呢 ? 图 32.4 中 时 结 点 出 现 的 顺序 是 一 个 "位 反问 的 二 进 制 数 "”。 亦 即 ， 如 果 我 们 设 
rev(k) 为 把 k 的 一 进 制 表示 的 各 位 反 向 所 形成 的 1gn 位 的 整数 ， 则 我 们 希望 把 向 重 中 的 元 素 
3 放 在 数组 中 A[(rev(k)j] 的 位 置 上 。 例 如 ， 在 图 32.4 中 ， 叶 结 点 出 现 的 次 序 为 0，4，2， 
6、1、5，3，7: 这 个 序列 用 二 进 制 表 永 为 000，100、010，110，001，101，011，111。 把 
一 进 制 各 位 反 血 后 、 我 们 得 到 序列 000，001，010，011，100，101，110，111， 为 了 说 明 
我 们 希望 获得 一 般 情 况 下 的 位 反 向 二 进 制 顺序 ， 注 意 到 在 树 的 最 顶层 ， 最 低位 为 0 的 下 标 被 
放 在 太子 树 中 ， 而 最 低位 为 ! 的 下 标 放 在 右 子 树 中 。 在 每 一 层 去 掉 最 低位 后 ， 我 们 沿 着 树 继 
续 这 一 过 程 ， 直 至 我 们 在 时 结 点 得 到 位 反 向 二 进 制 顺序 。 

则 十 图 数 rev(k) 的 值 很 容易 计算 ， 所 以 过 程 BIT-REVERSE~COPY 有 如 下 代码 : 


BIT 一 民 EYVERSE-COOPYIa， 有 ] 
1 me ength[a] 

2 for 和 tom 一 | 

3 do 页 [rev(kj]saai 


这 种 运 代 的 FFT 实现 方法 的 运行 时 间 为 @n IgEm。 调 用 BIT-REVERSE-COPY 的 运 
行 时 间 当 然 是 On lg om， 因为 我 们 选 代 了 次 并 且 可 以 在 OICE 问 的 时 间 内 对 一 个 在 0 到 
na-1 之 问 的 tn 位 整数 进行 反 向 操作 (实际 庶 用 中 ， 通 常 我 们 事先 就 知道 了 mn 的 初 值 )， 所 以 
我 们 可 能 计算 出 一 张 表 ， 求 出 每 个 上 的 revy(o， 可 以 使 BIT-REVERSE-COPY 的 运行 时 
间 为 Bln)， 且 该 式 中 隐 含 的 常数 也 较 小 。 此 外 ， 我 们 也 可 以 采用 问题 18-1 中 描述 的 方案 : 
好 精确 地 使 用 缓冲 反 向 一 进 制 计数 器 。 为 了 完成 对 命题 “ITERATIVE-FFT 的 运行 时 间 为 
Gin tg no) "的 让 明 ， 我 们 证 明 最 内 层 特 环 体 (第 9-12 行 ) 被 执行 的 次 数 LOn) 为 四 (lgm。 我 们 
有 


一 @(nlgn) 
- ”并行 FFT 电路 
我 们 可 以 利用 使 得 我 们 能 够 有 效 地 实现 适 代 FFT 算法 的 许多 性 质 产生 一 个 有 效 的 并 行 
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FFT 竺 法 { 和 参见 第 一 博思 章 关 于 组 合 电路 模型 的 摘 六 )。 图 32.5 说 明了 mn=8 时 ， 计 算出 关于 
nm 个 输入 的 FFT 的 组 全 电路 PARALLEL-FET。 电 路 一 开始 就 对 输入 进行 位 反 疝 排列 ， 其 
后 的 电路 分 为 节 a 级 ， 每 一 级 将 由 ny2 个 并 行 执行 的 蝴 屿 操作 所 组 成 。 因 此 电路 的 深度 为 
已 ( 18.m。 


NO WU ， 





| 贡 袜 守 于 号 


图 32.5 计算 FFT 的 组 合 电 路 PARALLEL-FET， 这 里 输 人 了 一 8 


电路 PARALLEL 一 FFT 的 最 左边 的 部 分 执行 位 反 向 排列 ， 其 余部 分 是 对 FFT 
一 BASE 过 程 的 模拟 。 我 们 在 设计 中 利用 了 以 下 事实 : 最 外 层 foer 循环 的 每 次 选 代 均 执 
行 D72 次 独立 的 可 以 并 行 执行 的 蝴 蝶 操 作 。 在 过 程 FFT -- BASE 中 每 次 适 代 的 值 s 对 应 于 
图 32.5 中 的 一 级 贿 狠 。 在 第 s 级 中 (= 1，2，…lgn)， 有 nyv2' 组 蝴蝶 (对 应 于 FFT 
-BASE 中 的 每 个 值 )， 每 组 中 有 2 ”个 蝴蝶 (对 应 于 FEFT 一 BASE 中 j 的 每 个 值 ). 
图 32.5 所 示 的 蝴 遇 对 谋 于 最 内 层 循 环 (FFT 一 BASE 的 第 8 一 11 行 ) 中 的 蝴 妈 操作。 还 黎 注 
意 ， 师 蝶 中 用 到 的 w 对 应 于 FFT-- BASE 中 用 到 的 那些 w: 在 第 s 级 中 ， 我 们 使 昨 
了 w-， 吧 ，， 有 其 中 国王 2 


级 


思 考 题 


32-1 分 治 乘法 


aa 说 明 如 何 仅 用 三 次 乘法 就 能 求 出 线性 多 项 式 ax+b 与 cx+td 的 磁 积 。( 提 示 : 有 一 个 乘 
法 运算 是 (a+b) (ec+d))。 

b. 试 写 出 两 种 分 治 算 法 , 使 其 在 @ne 习 的 运行 时 间 内 求 出 两 个 次 数 界 为 ma 的 多 项 式 的 
乘积 。 第 一 个 算法 把 输入 多 项 式 的 系数 分 成 高 阶 系数 与 低 价 系 数 各 一 半 ， 第 二 种 算法 根据 其 
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系数 下 标的 育 侦 性 米 进行 划分 。 
c. 证 明 : 在 On ) 步 可 以 计算 出 两 个 n 位 整数 的 乘积 ， 其 中 每 一 步 至 多 对 一 个 一 位 数 
依 的 常数 进行 操作 。 


32-2 Toephtz 和 托 星 


Teeplitz 把 阵 是 一 个 满 是 如 让 和 荣 件 的 多 关 耳 矩阵 和 三 (ai 让 aij 一 中-1j-1 1 一 2， 3 “将 
j=2，3，.…。，mn。 

a. 两 个 Toeplitz 定 阵 的 和 是 理 一 定 是 Toeplitz 矩阵 ? 其 积 允 如 何 ? 

b.、 试 说 明 妇 和 何 表示 Toeplitz 定 阵 才能 够 在 Onj 的 时 间 内 求 出 两 个 吕 xn Toeplitz 矩阵 的 
和 。 

fc， 写 出 一 个 运行 时 间 为 On lg I 的 算法 , 使 其 能 够 计算 出 nxn Toeepiitz 官 阵 与 n 维 辐 
量 的 乘积 。 请 在 算法 中 运用 人 (b) 中 的 Toeplitz 惩 阵 表示 法 。 

d. 写 出 一 个 有 效 算 法 , 使 其 能 够 计算 出 两 个 nxanToeplitz 矩阵 的 滋 积 , 并 分 析 算 法 的 运 
行 时 间 . 


32-3 ” 求 多 项 式 在 某 一 点 的 所 有 阶 导数 的 值 
已 知 一 个 次 数 界 为 n 的 多 项 式 Atz)， 其 寺 阶 导数 定义 如 下 : 


在 (xl) 如 果 t=0 
A" (zx 一 全 A' (9 如 果 1<tsn 一 1 
0 如 果 {t 关联 


根据 Atx) 的 系数 表示 和 一 已 知 点 x,， 我 们 希望 计算 出 A“(x,)，t 一 0，1，…，n 
一 ]。 
号 。 已 知 系数 b,， b ,、 ”有 b _ 满足 
AOD 一 下 b 人 一 x) 
说 明 如 何在 Oo) 的 时 间 内 计算 出 A”(x t 一 刁 ， 1 ， 四 一 ]. 
b。 说 明 如 何在 Ontgn) 的 时 间 内 找到 b ,b ,…b ,已 知 AGk 七 W) 攻 一 0，1，…，m 
一 ]， 


c. 证 明 : 
A(x 十 W) 一 Z 人 2 
其 中 的 一 a 站 ,并且 
fx 一 如 果 一 一 TDs<1l<0 
1t 


如 果 1 和 1 和 志 人 一 1 
d， 试 说 明 如 何在 O(nlgn) 的 时 间 内 求 出 A(x, + w;:) 的 值 ， k= 0，1，…，n 一 1.。 证 


kr 
mm 


2 f0)gtr -jj 





以 上) 一 


明 : 存 可 以 在 Dnlgn) 时 间 内 求 出 Afx) 的 所 有 非 平凡 导数 在 x， 的 值 。 


32-4 多 项 式 在 多 个 点 的 求 值 


我 们 包 既 注音 到 ， 运 用 霍 纳 法 则 就 能 够 在 Oo) 的 时 间 内 求 出 次 数 界 为 a1! 的 多 项 式 在 
单个 点 的 值 。 同 时 也 发 现 ， 运 用 FFT 也 能 够 在 On 吉 名 的 时 间 内 求 出 多 项 式 在 单位 元 素 的 . 
所 有 mn 个 复 根 处 的 秆 ， 现 在 我 们 就 来 说 明 如 何在 OUn lg 和) 的 时 间 内 求 出 一 个 次 数 界 为 n 的 
多 项 式 在 任意 nm 个 点 的 值 . 

为 了 做 到 这 一 点 ， 我 们 将 不 加 证 明 地 运用 下 列 结论 : 当 一 个 多 项 式 除 以 另 一 个 多 项 式 
时 ， 可 以 在 On lgnm) 的 时 间 内 计算 出 其 多 项 式 余 式 。 例 如 ， 多 项 式 3x+x“-3x+l 除 以 多 项 
式 x +x+2 所 得 的 余 式 为 

(3x 十 X 一 3x 十 1) mod TR TXT 一 SX 一 3 
己 知 多 项 式 A(O 一 了 a_x' 的 系数 表示 和 个 点 x, ，x ，…，x _，， 我 们 希望 计算 


内 nm 个 值 Atx )，A(x )，…，AGK ，)。 对 0< 和 isjsn-1， 定义 多 项 式 P,(O=T，Gx 
一 X Q， 一 AtxjmodP， [xj)，。 注 意 密 项 式 Qi oo 的 次 数 界 至 多 为 ] 一 ij 

a. 证 明 : 对 任意 点 z， 有 Atx)mod(x 一 嫉 王 入 (z)。 

b. 证 明 :Q CO = A(X 有 昌 Q， (09 一 AGOo。 

c.， 证明 : 对 i 和 KK 和 j， 有 Qi (9O=QiomodP oo Quoo = QicomodPuieog9. 

d， 给 出 -个 运行 时 间 为 O(nlg mn) 的 算法 以 求 山 AGx, )，Afx,)，…，A(x，，) 的 值 。 


32-5 运用 横 运 算 的 FFT 


嫩 其 定义 所 述 ， 离 散 傅 里 时 变换 要 求 使 用 复数 ， 因 此 由 于 售 人 误差 而 导致 精确 性 下 降 . 
对 某 些 问题 来 说 ， 我 们 已 知 其 答案 仅 包 会 整 数 ， 并 且 为 了 保证 准确 地 计算 出 答案 , 要 求 我 们 
科 用 基于 模 运 算 的 一 种 FFT 的 变异 例如， 求 两 个 整 系数 的 多 项 式 的 积 的 问题 就 属于 这 类 
问题 。 练 习 32.2-6 说 明了 这 类 问题 的 一 种 解决 办 法 ， 即 运用 一 个 长 度 为 中 (位 的 模 来 处 理 
n 个 点 的 PDFT。 本 问题 说 明了 另 一 种 解决 方法 ， 即 运用 一 个 长 度 更 为 合理 的 模 《 长 鹿 为 
OUlg m， 要 求 车 先 了 解 第 三 十 三 章 的 内 容 , 设 m 为 2 的 和 ) 。 

a. 假 定 我 们 寻找 最 小 的 k 使 p=kn+l 为 质数 。 试 给 出 下 列 结论 的 简单 而 有 启发 性 的 证 
明 : 我 们 预计 芭 约 为 1gnkk 的 值 可 能 比 jgna 大 一 些 或 小 一 些 ， 但 我 们 能 够 合理 地 预计 出 基 
的 OUtgm 个 候选 值 的 平均 值 })。、p 的 预计 长 度 与 n 的 长 度 有 何 关 系 ? 

设 六 是 Z 的 发 后 器 ， 并 且 设 w 一 外 mod p。 

b. 证 明 DFT 与 道 DFT 对 模 p 来 说 是 有 完备 定义 的 道 运算 ， 其 中 w 用 作 单 位 元 素 的 主 
n 次 根 

“. 论 证 对 模 p 来 说 ， 可 以 在 Da] 中 的 时 间 内 使 FFT 与 其 道 运行 ， 假 定 算法 已 知 P 和 
w， 并 生 在 长 雇 为 Oflgom 位 的 字 上 的 操作 仅 需 单位 时 间 。 

d. 对 模 p= 17， 计 算出 向 晤 (0，5，3，7，7，2，1， 名 的 DFT。 注 意 ，g=3 是 Z,， 的 发 
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生 器 。 
练习 三 十 二 


33.1-1 送出 式 (32.0 和 (32. 习 把 下 列 两 个 多 项 式 相 乘 : 和 (加 = 7X 一 xx 一 10，B 人 一 8 一 6x 十 3。 
33.1-? 求 一 个 次 数 界 为 m 的 多 项 式 A(x) 在 某 已 知 点 加 的 慎 世 可 以 用 以 下 方法 获得 :把 多 项 式 ACx) 除 
以 雪 项 式 (xxoj， 得 到 一 个 次 数 界 为 n-t 的 商 多 项 式 qz 和 余 项 r， 并 满足 
息 (x) 一 日] 一 xyHr 
旺 姥 Atxg) 一 rr。 试 说 明 如 僻 根 所 xo 和 名 的 系数 在 全 (no) 的 时 间 内 计算 出 余 项 了 以 及 qt 中 的 系数 。 
32.4-3 根据 A(o)= 开 ”aix 的 点 值 表 示 推 导出 AT” CD = 工 ，。a。 jx 的 点 值 表示 ， 假 定 没有 一 个 
点 是 0。 . 
331-4 说 明 如 何 订 用 等 式 (32.5) 在 @(o 的 时 间 内 进行 插值 运算 . (提示 : 先 计算 TTix-xbg 和 
TILAx-x 由 然后， 把 每 个 项 分 别 除 以 (x-xo9 和 (xx0。 参 见 练习 32.1 一 人 
323.1-5 试 解 释 在 采用 点 优 表 法 时 ， 用 “显然 "的 方法 来 进行 多 项 式 除 法 错误 在 何 处 ， 试 对 除法 有 确 
切 结 果 与 无 确切 结果 丙种 情况 分 别 进 行 讨论 , 
33.1-6 考察 帅 个 代 合 总 和 B、 每 个 集合 包含 取 值 范围 在 0 到 10n 之 间 的 na 个 整数 。 我 们 希望 计算 出 
所 纯 日 的 萌 卡 水 和 ， 筷 的 定 关 如 下 : 
人 一 1 TY KE、 色 ,7 下 - 
注意 ，C 中 整数 的 捕 值 范 用 在 -0 到 20n 之 图 。 我 们 希望 求 出 尼 中 的 元 囊 ， 并 且 求 出 忆 的 每 个 过 素 可 为 入 
与 B 中 元 素 的 和 的 次 数 。 证 明 : 解 快 这 个 问题 需要 On ]z 问 的 时 间 { 用 10n 次 多 项 式 来 表示 和 与 相 


33.2-1 证 明基 论 32.4 

33.1 一 > 计算 向 最 (0，、，41，2、3 习 的 人 FT， 

332,2-3 使 用 运行 时 间 为 昌 n lg 癌 的 方案 重 做 练 刁 32.1 一 1。 

33.2-4 好 出 在 @tn 过 加 的 运行 时 间 内 计算 出 DFT ”的 伪 代 码 。 

32.2-5 试 把 FFT 过 程 推广 到 nm 是 3 的 等 的 情形 ， 写 出 其 运行 时 间 的 递 好 式 并 求解 该 式 。 

32.2-6*+ 和 候 定 我 们 不 是 在 复数 域 上 执行 a 个 元 素 的 FETOn 为 偶数 )]， 而 有 是 在 整 娄 模 mm 所 生成 的 环 Z 
上 执行 FFT， 其 中 辐 = 和 2 亲 1， 并 且 t 是 任意 正 束 教 。 对 模 种， 用 训 = 关 来 代 震 w, 作为 单位 元 吉 的 主 m 
的 根 ， 证 明 : 在 该 系统 中 DFT 与 道 DFT 有 完备 锡 习 

3 局 知 一 组 值 az ……， 。 (可 能 有 重复 )， 说 明 如 俩 求 出 仅 在 aa，z，…，z ,处 ( 可 能 有 重 
复 ) 什 为 0 的 次 数 界 为 日 的 多 项 起 PC 的 系数 。 所 给 出 的 过 程 的 运行 时 间 应 该 是 Dtn lg 名 j 提 永 : 儿 项 式 
Btx) 在 五 处 值 为 0 当 且 公关 P(x) 是 (x 一 相 ) 的 倍数 )。 

31.2-8* 各 量 a=(an ai，……，au- 的 chirp 变换 是 向 量 y= Go，yi，…，g-D， 其 中 由 = 开 ， aiz ， 
z 是 仁 汪 息 数 ， 因 此 , PEFT 是 chirp 变换 的 一 种 特殊 情 瓷 (zz 一 wj。 证 明 : 对 任意 复数 z 可 以 在 On lgo) 的 
时 间 内 求 出 chirp 灾 换 的 值 。 《 担 沙 : 运 轴 等 式 


y 一 (se je 


卫 二 香 


可 以 把 chitp 变 换 看 作 一 个 郊 积 ) 


32.3-1 ， 试 说 明 如 何 用 过 程 ITERATIVE-FFT 计算 出 输 人 向 量 (0，2，3，-1，4、5，7， 尺 的 DFT。 

33.3-3 斌 说 明 如 何 把 位 反 窗 排列 放 在 计算 过 程 的 最 后 而 不 是 在 其 开始 处 ， 则 样 也 能 实现 PPT 算法 ， 

32.3-3 为 了 计算 出 DFT,， 在 本 节 所 撒 述 的 PARALLRI 一 FFT 电路 中 需要 客 少 个 加 落 、 减法 和 乘法 
元 件 ? 芭 需要 多 少 条 上 路 线 攻 假定 把 一 个 数 从 一 处 传输 到 另 一 处 妈 需 要 一 条 线路 ) 
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32.3-4* 假设 FFT 电路 中 的 加 法 器 有 时 会 发 生 错 误 ; 不 论 力 人 人 如何， 它们 的 输出 总 是 为 0。 假定 恰 
也 有 一 个 加 法 器 发 生 上 述 情况 ， 但 读者 并 不 知道 是 最 一 个 邵 法 髓 。 如 何 能 够 道 过 给 整个 FFT 电路 提供 输入 
值 并 观察 其 输出 来 拷 到 那个 产 牛 错误 的 加 法 器 ?尽量 使 过 程 以 较 商 的 效率 执行 . 
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第 三 十 三 章 ”“ 有 关 数 论 的 算法 


数论 一 度 被 认为 是 漂亮 的 但 却 没 什么 大 用 处 的 纯 数 学 学 科 。 人 今天， 有关 数 论 的 算法 已 被 
广泛 使 用 ， 部 分 是 因为 基于 大 素数 的 密码 系统 的 发 明 。 这 些 系统 的 可 行 之 处 在 于 我 们 能 够 容 
易 地 求 出 大 素数 ， 而 系统 的 可 靠 性 在 于 大 素数 的 积 难 以 分 解 。 本 章 介 绍 了 一 些 基 本 的 数论 知 
识 和 相关 的 算法 ， 它 们 都 是 我 们 应 用 数论 的 基础 

33.1 节 介 绍 了 数论 的 基本 概念 ， 例 如 可 除 性 、 模 等 价 和 唯一 因子 分 解 等 。33.2 节 要 和 研 
究 一 个 很 十 老 的 算法 : 关于 计算 两 个 整数 的 最 大 公 因 数 的 欧 几 里 德 算法 。33.3 节 中 同 顾 了 
模 运 算 的 概 售 。33.4 节 讨 论 了 一 个 已 知 数 a 的 倍数 模 n 所 得 到 的 集合 ， 并 说 明 如 何 利用 欧 
几 里 德 算 法 来 求 出 方程 ax 一 b(modmn) 的 所 有 解 。33.5 节 中 冰 述 了 中 国 余数 定理 。33.6 节 
考察 了 已 知 数 a 的 等 模 a 所 得 的 结果 ， 并 阐述 了 一 种 已 知 a，b 和 mn， 可 以 有 效 地 计算 a" 模 
n 的 反复 平方 算法 。 这 一 运算 是 有 效 地 进行 素数 测试 的 中 心 问 题 。33.7 节 描 述 了 RSA 公开 
密 钥 加 密 系 统 ，33.8 节 主 要 讨论 了 随机 性 素数 测试 ， 它 可 以 用 于 有 效 地 找 出 大 款 数 ， 这 是 
我 们 为 SA 加 密 系 统 构造 密 钢 的 过 程 中 所 必须 完成 的 基本 任务 。 最 后 ，33.9 节 回 顾 了 一 种 
把 小 整数 分 解 因子 的 简单 而 有 效 的 启发 性 方法 。 令 人 惊奇 的 是 人 们 往往 希望 分 解 因 于 是 一 个 
难于 处 理 的 问题 ， 这 也 许 是 因为 RSA 系统 的 安全 性 取决 于 对 大 整数 进行 因子 分 解 的 困难 程 
度 吧 。 


输入 的 规模 与 算术 运算 的 代价 


因为 我 们 将 处 理 一 些 大 整数 ， 所 以 需要 调整 一 下 看 法 : 如 何 奢 待 输入 规模 和 算术 运算 的 
代价 ? 

在 本 章 中 ， 一 个 “大 的 输入 "意味 着 输入 包含 “大 的 整数 "， 而 不 是 意味 着 输 和 人 中 包含 “ 许 
多 整数 " (如 排序 的 情况 )。 因 此 ， 我 们 将 根据 表示 输 人 数 所 要 求 的 位 数 来 衡量 输入 的 规模 ， 
而 不 是 仅 根据 输入 中 包含 的 整数 个 数 来 衡量 。 我 们 说 ， 具 有 整数 输入 ai，az，…，at 的 算 
法 是 多 项 式 时 间 算 法 仅 当 其 运行 时 间 表 示 是 lgal，lga，…，l1lga 的 多 项 式 ， 即 它 是 转换 
为 一 进 制 的 输 和 长 度 的 多 项 式 。 

在 本 书 大 部 分 章节 中 ， 我 们 发 现 把 基本 算术 运算 (乘法 、 除 法 或 余数 的 计算 ) 看 作 仅 需 
一 个 单位 时 间 的 原 语 操 作 是 很 方便 的 。 通 过 计算 一 个 算法 所 执行 的 这 种 算术 运算 的 次 数 ， 我 
们 就 可 以 以 此 为 基础 合理 地 估算 出 算法 在 计算 机 上 的 实际 运行 时 间 。 但 是 , 当 输入 值 很 大 时 
基本 操作 也 可 能 是 费时 的 ， 因 此 衡量 一 个 数论 算法 所 要 求 的 位 操作 的 次 数 将 是 比较 适宜 的 。 
在 这 种 模型 中 ， 用 普通 的 方法 进行 两 个 位 整数 的 雏 法 需要 进行 @(P) 次 位 操作 。 类 似 ， 
地 ， 一 个 有 位 整数 除 以 一 个 短 整 数 的 运算 ， 或 者 求 一 个 有 位 整数 除 以 一 个 短 整 数 所 得 的 余 
数 的 运算 ， 也 可 以 用 简单 算法 在 @k82) 的 时 间 内 究 成 《参见 练习 33,1-11)。 目 前 也 有 更 快 
的 算法 。 例 如 ， 关 于 两 个 有 位 整数 相 乘 的 一 种 简单 分 治 算法 的 运行 时 间 为 B(8 )， 目 前 已 
知 的 最 快 算法 的 运行 时 间 为 B(6 lg Blg 地 及。 在 实际 应 用 中 时 ，G(pP2) 的 算法 常常 是 最 好 
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的 算法 ， 我 们 将 用 这 个 界 作 为 我 们 分 析 的 基础 。 
在 本 章 中 ， 我 们 在 分 析 算 法 时 一 般 既 考虑 算术 运算 的 次 数 , 也 考虑 它 所 要 求 的 位 操作 的 
次 效 ， 


33.1 ”基本 的 数论 概念 


本 节 将 简单 地 回顾 有 关 整 数 集 合 Z={…，-2，--1，0，1，2，…} 和 自然 数 集合 
N=1，1，2，…} 的 最 基本 的 数论 概念 。 


可 除 性 与 约 数 


一 个 整数 能 被 只 一 个 整数 整除 的 概念 是 数论 中 的 一 个 中 心 概念 ， 记 号 dla( 读 作 “d 除 a”) 
意味 着 对 某 个 整数 X， 有 a=kd。0 可 被 每 个 整数 整除 。 如 果 a>0 且 dla， 则 ldj 和 四。 如 果 
dia， 则 我 们 也 可 以 说 a 是 d 的 倍数 。 如 果 a 不 能 被 4 整除 ， 则 写作 d#f a。 

如 果 dla 并 且 dz0， 则 我 们 说 d 是 a 的 约 数 。 注意 ，dla 当 且 仅 当 -dla， 因 此 定义 约 数 
为 非 负 整 数 不 会 失去 一 般 性 ， 只 要 明白 a 的 任何 约 数 的 相应 负数 同 祥 能 整除 a。 一 个 整数 a 
的 约 数 最 小 为 1， 最 大 为 all。 例如 ，24 的 约 数 有 1，2，3，4，6，8，12 和 24。 

每 个 整数 a 都 可 以 被 其 平凡 约 数 1 和 a 整 除 .， a 的 非 平凡 约 数 也 称 为 a 的 内 子 。 例 如， 
20 的 因子 有 2、4，5 和 10。 


素数 与 合 数 


对 于 基 个 整数 a> 1， 如 果 它 仅 有 平凡 约 数 1 和 a， 则 我 们 称 a 为 素数 (或 质数 ) 。 素 数 
具有 许多 特殊 性 质 ， 在 数论 中 举足轻重 。 按 顺序 ，、 下 列 为 一 个 小 素数 序列 : 
2，3，5，6，11，13，17，19，23，29，31，37，41，43，47，53，359， 
练习 33.1-! 去 求 读 者 证 明 有 无 穷 多 个 素数 。 不 是 素数 的 整数 a> ]1 称 为 合 数 。 例 如 ， 因 
为 有 引 39， 所 以 39 是 合 数 。 整 数 1 被 称 为 基数 ， 它 既 不 是 质数 也 不 是 合 数 ， 类 似 地 ， 整数 
n 和 所 有 负 整数 妍 不 是 索 数 也 不 是 合 数 。 


除法 定理 ， 余 数 和 同 模 


已 知 一 个 整数 mn， 所 有 整数 都 可 以 分 划 为 是 na 的 局 数 的 整数 与 不 是 an 的 倍数 的 整数 。 对 
上 不 是 mn 的 倍数 的 那些 整数 ， 我 们 又 可 以 根据 它们 除 以 nm 所 得 的 余数 来 进行 分 类 ， 数 论 的 
大 部 分 理论 都 是 基于 上 述 分 划 的 。 下 列 定理 是 进行 这 种 分 划 的 基础 。 此 处 将 不 给 出 该 定理 的 
证 明 过 程 。 
定理 33.1 (除法 定理 ) “对 任意 整数 a 和 任意 正 整 数 n， 存 在 唯一 的 整数 q 和 zr， 满 足 
0<Tr 和 nn， 并 且 a=qn+r。 
值 gq= iayxynj 称 为 除法 的 商 。 值 rz=a mod nm 称 为 除法 的 余数 。 我 们 有 nla 当 且 仅 
当 amodn= 人 0， 并 且 有 下 式 成 立 : 
4 一 an pnp+ (amodnl) 【33.1) 
或 
a mod nn 一 3 一 [an 0n 【33.2) 
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当 我 们 定义 了 一 个 整数 内 以 另 一 个 整数 的 余数 的 概念 后 ， 就 可 以 很 方便 地 给 出 表示 条 余 
的 特殊 记 法 。 如 果 (armodtm = 人 bmodn， 就 写作 as=bl(imnodn)， 并 说 a 和 hb 对 模 m 是 
相等 的 。 换 名 话说 ， 当 a 和 bb 除 以 n 有 着 相同 的 余数 时 ， 有 abp(mod pb) ， 等 价 也 有 ，a= 
bl mod ay 当 且 仅 当 ml (tay。 如 果 a 和 b 对 模 Dn 不 相等 ， 则 写作 a 基 Binod n)。 例 如 ， 
61=6(mod 11)， 同 样 ，-13=22=2(0mod 3) 。 

根据 整数 模 .n 所 得 的 余数 可 以 把 整数 分 成 mn 个 等 价 类 。 模 nm 等 价 类 包含 的 整数 a 为 : 

[一 {a+kn: kCZ} 

例如 ，[3],= {…，-11，-4，3，10，137，…}， 该 集合 还 有 其 他 记 法 : 广 略 ， 0 

k [b], 就 等 同 计 ab modn)。 所 有 这 样 的 等 价 类 的 集合 为 : 


Z, 一 《al 0 和 asn-1} (33.3) 
我 们 径 澡 厚 到 定义 | 
Z, = 上，1，…，Hn 一 |]} {33.4) 


如 果 用 0 下 [0 用 ! 表示 [1, 等 等 ， 等 一 类 均 用 其 最 小 的 非 负 元 素来 表示 ， 0 
定义 {33.3) 与 (33.4) 是 等 价 的 ， 但 是 ， 我 们 必须 记 住 相 应 的 等 价 矢 ， 例如 ， 提 到 Z。 
元 素 一 1 就 是 措 [o_11 因为 -1=n 一 区 maod 9 


公约 数 与 量 大 公约 数 


如 果 d 是 a 的 钓 数 并 且 也 是 的 约 数 ， 则 则 是 a 与 b 的 公约 数 。 例 如 ，30 揭 约 数 为 
1，2，3，5，6，10，15，30， 因 此 24 与 30 的 公约 数 为 1，2，3 和 6。 注意 ，1 是 任意 两 个 
整数 的 公约 数 。 

公约 数 的 一 条 重要 性 质 为 : 


dia 并 且 dlb 世 售 dl (a+b) 并 且 d 《a-b) (33.5) 
更 一 般 地 ， 对 任意 整数 x 和 Yy， 我 们 有 
dla 并 且 dlb， 寿 含 dl (ax+by) [33.61 
同样 ， 如 果 alb， 则 或 者 lal 过 |bl， 或 者 世 =0， 这 说 明 : 
若 alb 并 且 bla， 出 a= 土 b。 (33.7) 


两 个 不 同时 为 0 的 整数 a 与 b 的 最 大 公约 数 是 其 全 的 最 大 公约 数 ， 表 未成 gcdla，Pby， 
例如 ，gcd(24，30)] 王 6，gcd(5，7) =1，gcd(0、9) =9。 如 果 a 与 bb 不 同时 为 0， 出 
gcdta，b) 是 一 个 在 1 与 mintlal，fbl) 之 间 的 整数 。 我 们 定义 gcd(0，0]j =0， 这 个 定义 对 
于 使 ged 函数 的 一 般 性质 〈 如 下 面 的 式 《33.11)) 普通 正确 是 必 不 可 少 的 


下 列 性 质 就 是 gcd 画 数 的 基本 性 质 : 
gcd(a，bj =gcdlb，aj} (33.83) 
gcd(a，b) 一 gcd( 一 na，hb) (33.9) 
gcd(a，b) 一 gedflal， 人 bl) (33.10) 
gcdta，0) 一人 | 33.411) 
gcdta，ka)j 一 得 对 任意 的 kEZ -03.12) 


定理 33.2 如 果 a 和 bb 是 不 都 为 0 的 任意 整数 ， 则 gcdta，hb) 是 a 与 b 的 线性 组 合集 
合 {ax+by: x，yYC Z 中 的 最 小 正 元 素 ，. 
证 了 明 : 设 s 是 a 与 bb 的 线性 组 合集 中 的 最 小 正 元 素 ， 并 且 对 革 个 xx yE Z， 有 
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s 一 ax+by， 设 q= 1 avsj， 则 式 (33.2) 说 明 
和 rmOdG S 一 呈 一 中 8 
= 3 一 q(ax+by》 
一 atI 一 4x) 十 bt 一 qy) 
本 此 .amods 也 是 aa 与 b 的 一 种 线性 组 合 。 但 由 于 amods<s， 所 以 我 们 有 a mod s 一 0， 
四 为 是 满足 这 样 的 线性 组 合 的 最 小 正 数 。 因 此 有 sla， 并 且 类 似 可 推 得 slb。 因 此 ， s 是 a 
与 b 的 公约 数 ， 所 以 ged(a，b) 兰 8S。 因 为 gcd(a，b) 能 则 时 被 a 与 b 整除 并 且 s 是 a 与 bb 
一 个 线性 组 合 ， 所 以 由 式 (33.6) 可 知 gcd(a，b) |ls。 但 由 gcdta，b) ls 和 s>0， 可 知 
gcedfta，b) 么 s。 面 于 面包 证 明 gcd(a，b) 关 s， 所 以 得 到 gcd(a，b) =s， 我 们 因此 可 得 到 s 
是 a 与 b 的 最 大 公约 数 。 
推论 33.3 ”对 任意 整数 a 与 b、 如 果 dla 并 且 dlb， 则 dlged(a，b)， 
证 明 : 根据 定理 33.2，8sgcdfa、hb)j 是 a 与 bb 的 一 个 线性 组 合 ， 所 以 从 式 (33.6) 可 推 得 
该 推论 成 立 。 
推论 33.4 ”对 所 有 整数 a 和 b 以 及 任意 非 负 整 数 na，gcd(an，bn) =ngcd(a，Pb)。 
证 明 : 如 果 m=0， 该 推论 显然 成 立 。 如 果 mn>0， 则 gecdlan，bn) 是 集合 {anx+hbny} 中 
的 最 小 证 元素 ， 却 为 集合 fax+by} 中 的 最 小 正 元 素 的 mn 倍 。 
推论 33.5 ”对 所 有 正 整 数 nmn，a 和 hb， 如 果 nlab 并 且 ged(a，n = 一 1， 则 mib。 
证 明 : 证 明 过 程 留 作 练习 33.1 一 4。 


互 质数 


如 果 两 个 整数 a 与 b 仅 有 公 因 数 1， 即 如 果 gcd(a，b) =1， 则 a 与 b 称 为 互 质数 。 例 
如 、8& 和 15 是 也 质数 ， 因 为 8 的 约 数 为 1，2，4，8， 而 15 的 约 数 为 1，3，5，1S$。 下 列 定 
理 说 明 如 果 上 商 个 整数 中 每 一个 数 都 与 一 个 整数 互 为 质数 ， 则 它们 的 积 与 p 与 互 为 质数 。 

定理 33.6 对 任意 整数 a，b 和 pp， 如 果 gcd(a，Pp) =1 且 gcdfb，p) =1， 则 
sgcdktab，bpb] 三 1 

证 明 : 由 定理 33.2 可 知 ， 存 在 整数 x，y，x“，yY 满 足 

aX+PYy 一 1 
bx +pPy 一 
把 上 面 两 个 等 式 两 边 相 乘 ， 我 们 有 
abftXX ) 十 PbX +Y'ax+pYyY") =] 
国 为 1 是 ab 与 的 一 个 正 线性 组 合 ， 所 以 运用 定理 33.2 就 可 以 证 明 所 需 结论 ， 
对 于 整数 mn，m，… ， 如 果 对 任何 i 才 j 都 有 pedni，m) = 一 1， 则 说 整数 nl，n2， 
，fRk 两 两 互 质 。 


唯一 的 因子 分 解 


下 列 结 论说 明了 关于 素数 的 可 除 性 的 一 个 基本 但 重要 的 事实 。 
定理 33.7 ”对 所 有 素数 Pp 和 所 有 整数 a，b， 如果 plab， 则 pla 或 者 ph。 
证 明 : 为 了 引 人 了 矛盾 ， 我 们 假设 plab， 但 pfa 并 且 bfb。 因 此 ，sgcd(a，p) =1 且 
gedtb，p) =1， 这 是 因为 p 的 约 数 只 有 1 和 PPp。 又 国 为 假设 了 p 本 不 能 被 a 也 不 能 被 bp 整 
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著 . 据 定 理 33.6 可 知 , gcdlab，p] =1; 又 由 假设 plab 可 知 gcd(p，ab) =bp, 于 是 产生 减 
盾 ， 从 而 证 明定 理 成 立 。 
从 定理 33.7 可 推断 出 ， 一 个 整数 分 解 为 素数 的 因子 分 解 式 是 唯一 的 。 
定理 33.8 .( 信 一 因子 分 解 ) 台数 a 仅 能 写成 一 种 如 下 积 的 形式 
a 一 了 1p7 ， 0D-… 
其 中 p, 为 素数 ，p <p, < …<p.， 且 e 为 任意 正 整数 。 
证 明 : 证 明 过 程 留 作 练习 33.1 一 10.。. 


例如 ， 数 6000 可 唯一 地 分 解 为 ?2”. 3 
33.2 最 大 公约 数 


在 本 节 中 ， 我 们 运用 欧 几 里 德 算法 来 有 效 地 计算 出 两 个 整数 的 最 大 公 绝 数 。 在 对 其 运行 
时 间 的 分 析 中 ， 我 们 惊奇 地 发 现 它 与 Fibonacci 数 存 在 着 联系 ， 由 此 可 获得 欧 儿 里 德 算法 在 
最 坏 情 况 下 的 输 人 。 
在 本 台中 我 们 仅 限于 对 非 负 整数 的 情况 进行 讨论 。 这 一 限制 是 有 道理 的 ， 因 为 由 式 
{33.10) 可 知 gcd(a，b) = gcd(al，lbl)。 
蛛 则 上 讲 ， 我 们 可 以 根据 aa 和。 的 素 因 于 分 解 中 求 出 正 整数 a 和 hb 的 最 大 公约 数 
gcd(a，b) 。 的 确 ， 如 果 


且 一 pi p2 PP， (33.13) 

b = p， p:- BY (33.14) 
则 

gcdta，b) = peie'， 有 Pei) it 全 (33.15) 


我 们 将 在 33.9 节 中 证 明 ， 目 前 已 知 的 最 好 的 分 解 因子 算法 也 不 能 达到 多 项 式 运行 时 
间 。 因 此 ， 根 据 这 种 方法 来 计算 最 大 公约 数 不 大 可 能 获得 一 种 有 效 的 算法 . 

计算 最 大 公约 数 的 欧 几 里 德 算法 基于 下 面 的 定理 ， 

定理 33.9 (GCD 递归 定理 ) ”对 任意 非 负 整数 a 和 任意 正 整数 b， 

gcdta，b) =gcdtb，amod by) 

证 明 : 我 们 将 证 明 ged(a，b) 与 gcd(b，a mod bj) 可 以 互相 整除 ， 这 样 几 样 (33.7) 
可 知 它 们 一 定 相等 (因为 它们 都 是 非 负 整数 ) 。 

我 们 先 来 证 明 gcd(a，bj |gcd(tb，a mod b) 。 如 果 我 们 设 d= gedta，by， 则 djla 并 且 
dlb。 由 等 式 (33.2) 可 知 (amoed b) =a-qb， 其 中 q= 【avybj。 这 样 ， 央 为 (amod b) 
是 a 渎 b 的 线性 组 合 ， 所 以 由 等 式 (33.6) 可 知 dl (fa mod b)。 困 此 ， 因 为 db 并 且 dl (a 
modb)， 由 推论 33.3 可 得 dlged (b，a moed B)， 吉 者 等 价 地 ， 有 

gcd(a，b) |gcd(b，a tnod b) (33.16) 

证 明 gcd(b， a mod bj 1gcd(la，hb) 的 过 程 几 乎 与 上 面 的 过 程 一 样 。 如 果 我 们 设 
d=gced(b，a mod b) ， 岗 dlb 并 且 dla mod b)。 由 于 a=qb+ (a mod bl)， 其 中 qg= 
L abj， 项 以 a 是 b 和 (amod b) 的 一 个 线性 组 合 。 根 据 式 〈33.6) 可 得 da。 由 于 dlb 并 
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且 dia， 所 以 根据 锥 论 33.3， 我 们 有 dlgcd(a，b)， 或 者 等 价 地 有 
gcd(b，amod ) |gcd(a，hb) 《33.17) 
运用 式 33.7， 再 根据 式 (33.16) 与 《33.17) 我 们 就 可 以 完成 定理 的 证 明 。 


欧 几 里 德 算法 


下 列 ged 算法 出 现 于 欧 几 里 德 时 代 ， 它 是 直接 基于 定理 33.9 之 上 的 一 个 递归 程序 ， 输 
人 a 和 者 是 任意 非 负 整数 。 


EUCLIDa，hb) 

1 让 和 b= 站 

立 then Tetuta 和 甩 

3 else ITeturm EUCLIDLb，a mod 1 


我 们 来 举例 说 明 EUCLID 的 运行 过 程 。 考 虑 gcd(30， ?21) 的 计算 过 程 : 
EUCLID(30，21) =EUCLID(21，9) 
=EUCLID(9，3) 
=EUCLID(3，0) 
一 3 
在 这 个 计算 过 程 中 三 次 递归 调用 了 EUCLID。 
过 程 EUCLID 的 正确 性 可 从 定理 33.9 以 及 下 列 事实 稚 出 : 如 果 竺 法 在 第 2 行 返 回 a， 
则 b=0， 凡 此 由 式 (33.11) 可 知 gcd(a，b) =8gcd(a， 科 =a。 因 为 在 递归 调用 中 第 二 个 
肯 变 量 的 值 严格 递减 ， 所 以 算法 不 可 能 无 限 递归 下 去 。 因 此 ，EUCLID 在 运行 终止 时 总 能 
求 出 正确 的 答案 。 


EUCLID 算法 的 运行 时 间 


我 们 来 分 析 一 下 EUCLID 在 最 坏 情 况 下 的 运行 时 间 。 可 以 把 它 看 成 输 人 aa 与 b 的 大 小 
的 函数 , 不 失 一 般 人 性 ， 我 们 假定 a> bz0。 这 个 假设 的 合理 性 是 基于 下 述 观 察 的 ; 如 果 b>a 
2>0， 则 EUCLID(a，b) 立即 会 递归 调用 EUCLID(b，aj， 即 如 果 第 一 个 自 变量 小 于 第 二 
个 御 变量 ， 则 EUCLID 进行 一 次 递归 调用 以 使 两 个 自 变 量 对 换 然后 继续 往 下 执行 。 类 似 
地 ， 如 果 b=a>0， 则 过 程 在 进行 一 次 递归 调用 后 就 终止 执行 ， 因 为 amodb=0 

过 程 EUCLID 的 运行 时 间 与 其 递归 调用 的 次 数 成 正比 。 我 们 的 分 析 过 程 中 用 到 了 由 地 
果 式 《2.13) 定 尽 的 Fibonacci 数 FF 

引 理 33.10 ”如果 a>bz#0O 并 且 EUCLID(a， b) 执行 了 六 z1 次 递归 调用 ， 则 a 
Fl ，b 基 FF，，。 

证 明 : 我 们 通过 对 X 进行 归纳 来 证 明 引 理 、 作 为 归纳 的 基础 ， 设 k= 1， 网 bz12F， 
又 由 于 a>b， 故 必 有 a 苦 2=F;。 因 为 b>(aimod bl)， 即 在 等 次 递归 调用 中 第 一 个 变量 严格 
大 于 第 一 个 变量 ， 因 此 对 每 次 递归 调用 ， 假 设 a>b 都 成 立 。 

现在 我 们 进行 归纳 ， 假 设 执行 k!1 次 递归 调用 时 引 理 成 立 。 我 们 将 证 明 若 执行 k 次 递 
归 调 用 引 理 同样 成 立 。 因 为 k> 0， 所 以 我 们 有 b>0， 并 且 EUCLID(a，b) 递归 调用 。 根 
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据 归 纳 人 和 假设， 可 知 bzF,, 《因此 也 就 证 明了 引 理 的 一 部 分 )， 并 且 有 (amodbj 兰 Fr。 我 
们 有 
ba imod bj) 一 Ha 一 [ax bl.b) 
委 3 
由 于 由 a> 和 > 人 0 可知 axb 关 1， 因 此 
号 3btta mnodb) 
关 Fkki+RFk 
一 下 t+ 
下 面 的 定理 是 这 个 引 理 的 一 个 直接 推论 
定理 33.11 (Lame 定理 ) 对 任意 整数 kz>l， 如 果 a>bzPz0 且 b<Feali ， 则 
EUCLID(a，b) 的 递归 调用 次 数 少 于 《次 。 
我 们 可 以 证 明定 理 33.14 中 的 上 界 是 所 有 上 界 中 最 好 的 . .EUCELID 的 量 址 情形 下 的 输 
人 就 是 连续 的 Fibonaeci 数 。 因 为 EUCLID(F;,，F,) 仅 作 一 次 递归 调用 ， 并 县 对 k* 关 2， 我 
们 有 Fimod F,= FE， ， 所 以 我 们 也 有 下 式 成 立 : 
gcdfF， FUD= scdfFfF， mod FJ)=Bgcd(E FI) 
因此 ，EUCLIDIF, ,，F,) 愉 好 进行 了 t-! 次 递归 调用 ， 达 到 定理 33.11 中 的 上 罩 ， 
由 于 F, 约 为 @ 5 7/VS， 其 中 四 是 由 式 (2.14) 定义 的 黄金 分 割 率 (1+V5)72， 所 以 
EUCLID 执行 中 的 递归 调用 次 数 为 Q(lgb) (更 严格 的 上 下 界 请 参见 练习 33.2 一 5) 。 因 此 ， 
如 果 过 程 EUCLID 作用 十 两 个 有 位 数 ， 则 它 将 执行 D(8) 次 算术 运算 和 DO(8 ) 次 位 操作 
(假设 8 位 数 的 乘法 和 除法 运算 要 执行 D05) 次 位 操作 .) 问题 33-2 证 明 位 操作 次 数 的 界 为 
Op) . 


欧 几 里 德 算法 的 推广 形式 


现在 我 们 来 重 写 欧 蕊 里 德 算法 以 计算 出 其 他 的 有 用 信息 ， 特 别 地 ， 我 们 推广 该 算法 使 它 
能 计算 出 满足 直列 条 件 的 整 系数 xx 和 六 
晶 一 gcd(a，b) 一 axHby 《33.18) 
注意 ，x 与 y 可 能 为 0 或 负数 。 我 们 以 后 会 发 现 这 些 素 数 对 计算 模 乘 法 的 逆 是 非常 有 用 
的 。 过 程 EXTENDED-EUCLIPD 的 输入 为 任意 一 对 整数 并 下 一 一 个 注 足 式 (33.18) 的 三 
元 式 〈d，X，y。 


EXTENDED-EUCLID(a，b) 
1 让 站 = 

then returnta，1， 1) 
(dx 9 < 了 XTENDED-EUCLIDIb，a meod bb) 
介 ，X、 订 < 人、 一 axb 四 
tetutnt，x。Yy) 


ULh Ca 


33.1 用 计算 gcd(99，78) 的 例子 说 明了 EXTENDED_EUCLID 的 执行 过 程 。 
过 程 EXTENDED~EUCLID 是 从 过 程 EUCLID 衍生 出 来 的 。 第 1 行 等 价 于 
EUCLEID 第 1 行 中 的 测试 中 =0"， 如 果 b=0， 则 EXTENDED-EUCLID 不 仅 返 回 第 2 行 


中 的 d=a， 而 且 返 回 系 数 x=i 和 y=0， 以 使 a=ax+by。 如 果 be0， 则 
EXTENDED-EUCLID 首先 计算 出 满足 由 =gcdtb，amodb) 和 

由 一 bx aimodb) 六 (33.19) 
的 〈d，x，yY) 。 对 过 程 EUCLID 来 说 ， 在 这 种 情况 下 ， 我 们 有 d=gced(a，hb) 
=d=8cd(b，a mod bl) 。 为 了 得 到 满足 4= ax+by 的 x 和 y， 我 们 利用 等 式 = 由 和 式 
(33.2) 改写 式 (33.19) 为 : 

d 一 bx 十 (a 一 L av/bj b) yY 

=ay+b(x' 一 | aybj y) 
内 此 ， 当 我 们 选择 x=yY，y=x 一 1 av bj YY 时， 就 可 以 满足 等 式 d= ax+by， 这 样 也 就 

证 明了 过 程 EXTENDEPD~-EUCLID 的 正确 性 。 





图 33.1 当 输 入 为 99 和 78 时 ，EXTENDED-EUCLID 的 操作 例 示 


由 于 在 EUCLID 中 所 执行 的 递归 调用 次 数 与 在 EXTENDED-EUCLID 中 所 执行 的 递 
归 调 用 次 数 相等 ， 因 此 从 渐 近 意义 上 说 , EUCLID 与 EXTENDED-EUCLID 的 运行 时 间 
也 相同 ， 两 者 相差 不 会 超过 一 个 常数 因子 。 亦 即 ， 对 a>b>0， 递 归 调 用 的 次 数 为 O(lg 
b).。 


33.3 ” 模 运 算 


非 正式 地 ,我 们 可 以 把 模 运 算 与 通常 的 整数 运算 一 样 看 待 ， 但 要 知道 如 果 我 们 在 执行 模 
n 运算 ， 则 每 个 结果 值 x 都 由 对 模 n 来 说 与 x 等 价 的 集合 [0，1，…，nr- 了 匡 中 的 元 素 所 取代 
( 即 用 xmodn 来 取代 太 。 如 果 我 们 仅 限 于 运用 加 法 、 减 法 和 乘法 运算 ， 则 用 这 样 的 非 正式 
模型 就 足够 了 。 我 们 现在 所 要 给 出 的 关于 模 运 算 的 更 正式 的 模型 最 适合 用 数论 结构 来 描述 。 


有 限 群 


群 (S， 昌 ) 是 一 个 集合 S 和 定义 在 S 上 的 二 进 制 运算 旨 它 满足 下 列 性 质 : 

1. 封 六 性 : 对 所 有 a，bE SS， 我 们 有 a 中 bES。 

2. 单 位 元 素 : 存在 一 个 元 素 ec 8S， 满 足 对 所 有 at48S8， 有 ee 由 a=a 中 e=a 

3. 结 人 台 律 : 对 所 有 a，b，c& S， 我 们 有 (a 中 中 c=a 中 (hb 人 外 o 吕 。 

4. 北 元素: 对 每 一 个 ag S， 存 在 一 个 唯一 的 元 素 bcSs 满足 a 中 b=b 电 a=e. 

例如 ， 考察 一 个 我 们 热 知 的 在 加 法 运算 下 的 整数 Z 所 构成 的 群 (Z，+): 0 是 单位 元 
素 ，a 的 道 元 素 为 -a。 如 果 群 ($S， 四 ) 满足 交换 律 ， 即 对 所 有 a，bES. 有 aa 中 b= 
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b 中 a， 则 它 是 一 个 可 换 群 。 如 果 群 (S$， 中 ) 满 是 [S|< cc， 则 它 是 个 有 限 和 
根据 模 加 法 与 模 切 法 所 定义 的 内 


通过 对 槽 运用 加 法 与 箭 法 运算 ， 我 们 可 以 得 到 两 个 有 良 可 换 群 ， 其 中 m 为 一 个 正 整 
“。 这 些 群 是 基于 我 们 在 第 33.1 节 中 定义 的 整数 模 n 所 形成 的 等 价 类 的 基础 之 上 的 。 
为 了 定义 Z, 上 的 群 ， 我 们 需要 一 种 人 台 适 的 二 进 制 和 运算。 我 们 可 以 通过 重新 定义 普通 的 
加 法 运算 与 乘法 运算 来 获取 我 们 所 需要 的 这 种 运算 。Zn 上 的 加 法 与 乘法 运算 很 容易 定义 ， 
因为 卫 个 整数 的 等 价 类 唯一 决定 了 其 和 或 积 的 等 价 类 。 亦 即 , 如 果 a==81/ 《modny 和 b= 三 
bimodn)， 刚 
a 十 bs 十 b 《mod n) 
ab==ab 《modnm 
因此 ， 我 们 定义 模 加 潜 与 模 a 乘法 如 下 :; 《分 别 用 +n 和 -9 表示 ) 
[ajl,+.[b].=fa+b]， 
[alj。- ,jb].= [abj]。 
(减法 可 类 似 定 文 [al -Tb] = 上 -bl ， 但 除法 的 定义 要 复杂 一 些 .。 ) 这 些 事实 说 明 我 们 在 Z，。 中 
进行 计算 时 用 每 个 等 价 类 的 最 小 非 负 元 素 作 为 其 代表 很 方便 , 也 很 合理 。 我 们 可 以 像 通常 那 
样 对 这 些 代 表 雹 素 执 行 加 法 、 减 法 与 习 法 ， 但 每 个 结果 工 都 由 该 类 的 代表 元 素来 代替 ( 即 x 
modn 来 代替 1 





和 


en 
mr 





(9) tb) 
图 33.2 两 个 有 限 群 ， 其 等 价 类 图 代表 刺 癌 由 次 闻 


， 一 模 mn 加 法 的 定 兴 ， 我 们 可 以 定义 模 加 法 群 (Z， 二 )， 它 站 于 本 为 | 一 
几 332 OO 给 出 了 和 群 (Z，+e) 的 运算 表 。 
定理 33.12 系统 (Z,，+,) 是 一 个 有 限 可 换 和 群 。 


证 明 : 由 + 满足 交换 律 与 结合 律 可 以 推出 +。 满足 交换 律 与 结合 律 : 
(al + [bfj+ ={a+ 匡 十 cl 


一 四 十 人 b 十 避 。 
一 [+ ,tb 二 ,器 
[aa + ,上 ,= 中 二 b， 
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一 上 b 十 a 
= [6 + [al 
(Z,，+ ,) 的 单位 元 素 是 0 〔( 即 [01,)， 元 素 a (〈 即 [a],) 的 加法) 逆 元 素 是 元 素 
-a ( 即 [一 对 或 四 一 a],) ， 因 为 四 ,+ ,[ 一 a, = 划一 ]。= [0 
运用 模 ta 乘法 的 定义 ， 我 们 就 可 以 定义 模 n 乘法 群 (Z, ， ,) 。 该 群 中 的 元 素 是 乙 ， 
中 与 a 互 为 质数 的 元 素 组 成 的 集合 Z" : 
Z ={aj <eZ ，: gcdta，n)j = 1 
为 了 表明 Z” 有 完备 的 定义 ， 注 意 ， 对 0<a <n， 我 们 有 对 所 有 整数 k，a= (a 
二 kkn] (mod n) 。 因 此 根据 练习 33.2 一 3， 因 为 gcdfa，n) = 一 1， 所 以 对 所 有 整 
数 k，gcd(a + kn，n) = 1。 因 为 [a] = {fa+kn : keZj， 所 以 集合 Z 之 ”有 完备 定义 。 下 面 
是 这 种 群 的 一 个 例子 ; 
Z ,={1， 2，4，7，8，11，13，14} 
其 中 定义 在 群 上 的 运算 是 模 15 乘法 运算 〈 这 里 我 们 把 元 素 la] , 表示 成 a。) 图 33.2 (b) 


说 明了 群 (Z，， ,。) 。 例 如， 在 Z, 中 ,8 . 11 = 13(mod15) 。 该 群 的 单位 元 素 为 1。 


0 ] 2 3 4 5 6 7 8 59 0 4 1 
0 和 0 1I5 5 05 4 特 2 的 站 0 有 0 35 
1j26 1 4 1I6 56 3 6 4 2 6 36 jl 5 
2|52 27 2 42 17 5 32 7 47 22 62 37 12 
3|113 5 2 3 43 118 58 33 8 48 323 63 .38 
4|139 14 529 4 44 19 5 34 9 49 24 64 


图 33.3 在 al=5 和 nz:=13 时， 中 国 余 数 定 理 的 应 用 实例 


] 





定理 33.13 ”系统 (Z,. ，',) 是 一 个 有 限 可 换 群 . 

证 明 : 定理 33.6 说 明 (Z* ， ,) 是 封闭 的 。 与 定理 33.12 证 明 过 程 中 对 + ,的 证 明 
类 似 ， 我 们 可 以 证 明 `,。 也 满足 交接 律 和 结合 律 。 其 单位 元 素 为 [],。 为 了 下 上 明 逆 元 吉 存 
在 ， 设 a 是 Z” 中 的 一 个 元 素 并 设 (4，x，y) 为 EXTENDED -- EUCLID(a，m) 的 输出 
结果 , 则 d= 1， 因 此 asZ ， 并 且 ax +ny= 1 或 者 等 价 地 ax = 1l(modn)] 。 

因此 ，[x] 是 [al 对 模 a 乘法 的 着 元 素 。 关 于 逆 元 未 的 唯一 性 证 明 留 到 推论 33.26 以 


后 . 
在 本 章 的 后 面部 分 中 遇 到 群 (Z. ，+ ,) 和 (Z.，，.) 时 ， 为 了 方便 应 用 ， 我 们 仍然 


镍 代表 元 素来 表示 等 价 类 ， 并 且 分 别 用 通常 的 运算 记号 + 和 ， (或 并 置 ) 来 表示 运算 + ， 
和 - ,.。 另外， 对 模 n 等 价 也 可 以 用 之 中 的 方程 来 说 明 。 例 如 ， 下 列 两 种 表示 是 等 价 的 : 


8X 到 bmod 也) 
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[al [=[Ib。 
为 了 更 加 方便 ， 当 其 运算 从 上 下 文 可 知 时 我 们 有 时 仅 用 S 来 表示 群 (3$， 甲 ) 。 因 此 
我 们 可 以 分 别 用 Z， 和 Z， 来 表示 群 (Z ， 十 ) 和 {(Z ， ) 。 


一 个 元 索 a 的 法 道 元 索 表 示 为 (a mod n) ，Z， 中 的 除法 由 式 ahb 


= ab (mod ny》 定义。 例如 ， 在 Z” 中 ,我 们 有 7 ”= 13(mod 15) ， 因 为 7 13=91 
= !(mod 15) ， 这 样 就 有 47/7=4. 13 王 Ttmod 15) 。 
之 ， 的 规模 表示 为 p(n) 。 这 个 函数 称 为 欧 拉 II 范 数 ， 它 满足 王 式 ; 


om = nl 一 5 03.20) 
pm 


其 中 p 包括 能 被 n 整除 的 所 有 素数 (如 果 了 是 素数 ， 则 也 包括 本 身 )。 

我 们 在 此 不 对 这 个 公式 作出 证 明 。 从 直观 上 看 ， 我 们 开始 时 有 一 张 m 个 余 数组 成 的 表 
0，1，…，n-1}， 然 后 对 每 个 能 被 n 整除 的 素数 p， 在 表 中 划 挤 所 有 是 p 的 倍数 的 数 。 例 
如 ， 由 于 45 的 素数 约 教 为 5 和 3， 所 以 ， 


seo -0 


-全 ) 父 


= 24 
如 果 p 是 素数 ， 则 Z， = {1，2，…，pP 一 起 ， 并 且 


etp) 一 一 1 (33.21) 
如 果 n 是 合 数 ， 则 oltn) < 一 1 


于 群 


姐 洒 (3， 中 ) 是 一 个 群 ，S ”三 S， 并 且 (3 ”， 由 ) 也 是 一 个 群 , 则 全 ， 电 ) 称 
为 〈《S， 申 ) 的 子 群 。 例 如 ， 在 加 法 运算 下 ， 侣 数 形 成 一 个 整数 的 子 拜 下 列 和 定理 提 供 了 识 
引子 群 的 一 种 有 用 的 工具 。 

定理 33.14 (一 个 有 限 群 的 封闭 子 集 是 一 个 子 群 ) ”如 果 (3 ， 由 ) 是 一 个 有 限 群 ，S 
赴 S 的 一 个 任意 子 集 并 注 足 : 对 所 有 a，bkEgS”′ ， 有 aa 由 bts ， 则 (9 ， 由) 是 (SS， 
由 ) 的 一 个 子 群 . 

证 明 : 证 明 过 程 留 作 练 习 33.3 一 2。 

例如 ， 集 合 10，2，4，6 形 成 2 的 一 个 子 群 ， 这 是 因为 在 如 法 运算 下 它 具 有 封闭 性 ( 即 
在 + 下 它 是 封闭 的 )。 

下 列 定 理 对 子 群 的 规模 作出 了 一 个 非常 有 用 的 限制 。 

定理 33.15 ( 拉 格 朗 日 定理 ) ”如果 ( S, 申 ) 是 一 个 有 报 群 , (3 ”, 由 ) 是 (S, 由 ) 的 一 个 
子 群 ， 则 il ”| 是 | 的 药 数 。 

对 一 个 群 $ 的 子 群 $S′ ， 如 果 SS 扼 S， 则 子 群 S”′ 称 为 群 S 的 真子 群 。 我 们 在 第 33.8 
节 中 对 Miller 一 Rabin 素数 测试 过 程 中 将 用 到 下 列 推论 。. 


-一 9608 一 


推论 33.16 ”如 果 S ”是 有 限 群 $ 的 真子 群 ， 则 |I 字 “| 所 | 四 7 2。 
由 一 个 元 素 生 成 的 子 群 


定理 33.14 给 出 了 一 种 生成 一 个 有 限 群 (S$， 中 ) 的 子 群 的 有 趣 方法 : 选择 一 个 元 素 
a， 并 取出 根据 群 上 的 运算 由 a 押 能 生成 的 所 有 元 素 。 特别 地 ， 对 上 关 1 定义 a 0 如 下 : 


au 一 里 aa=3 外 a 四 中 


例如 ， 如 果 我 们 取 群 Z, 中 的 元 索 a=2， 序列 a” ，a”， 
为 : 2，4，0，2，4，0，2，4，0，… 

在 群 Z 中， 我 们 有 a“ = ka mod n， 在 群 Z” 中 ， 我 们 有 a ”=a' mod n。 由 a 
生成 的 子 群 用 <a> 或 (<a> ， 四) 来 表示 ， 其 定义 如 下 : 

<a> 一 fa :kz 

我 们 可 以 说 a 生成 子 群 <a> ,或 者 aa 是 <a> 的 生 或 者 。 因 为 SS 是 有 限 集 ， 所 以 <a> 
是 S 的 有 限 子 集 ， 它 可 能 包 售 S 中 的 所 有 元 素 。 由 四 满足 结合 律 可 知 

站 人 中 一 中 人 1 ， 
所 以 <a> 具有 封闭 性 。 根 据 定理 33.14 可 知 <a> 是 8 的 一 个 子 群 。 例 如 ， 在 Z 中， 
我 们 有 
<0> 一 {0} 
<1> 一 0，1，2，3，4， 纯 
<2> 一 人 0.2,4} 
同样 地 ， 在 Z; 中 ， 我 们 有 
<1> 一 (1 
<2> 一 {1，2，4} 
<3> 一 [1，2，3，4，5，6} 
在 群 S 中 的 次 序 用 ord(a) 来 表示 ， 定 义 为 满足 a ”= 日 的 最 小 的 t> 0。 

定理 33.17 . 对 任意 有 限 群 (S， 甲 ) 和 任意 asS， 一 个 元 素 的 次 序 等 于 它 生 成 的 子 群 
的 规模 ， 或 说 ord(a) =j<a>|。 

证 明 : 设 t= ordka) 。 因 为 an 一 e 并且 对 kz>1 有 Ba =aw 徙 ai =aw ， 所 
以 ， 如 果 i> t(， 则 对 某 个 j <i， 有 au = a9 。 因 此 ， 在 a” 后 面 不 会 出 现 新 元 素 ， 并 且 
0 ，a” au” }。 为 证 明 1<a>|=t 假设 为 了 引信 矛 盾 ， 对 某 个 满足 1 <i ， 
<js<t 的 1 和 j 有 ae 一 aag 。 则 对 KK>0， 有 ae =a 和 9 。 但 这 样 就 说 明 a 了) 
=atit) =e， 因 为 1i+(t-j) <t， 但 t 为 满足 a" =e 的 最 小 正 值 ， 这 样 就 产生 了 了 矛 
盾 ， 因 此 ， 序 列 a” ，a”，…，a"” 中 的 每 个 元 素 都 是 木 同 的 ， 所 以 |Ka?|=t。 
推论 33.18 ”序列 at ，a” ，… 是 周期 性 序列 ， 其 周期 为 t= ord(a) ; 即 a =a 
当 且 仅 当 i=jtmod 要 。 


<3 > 一 1 
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对 所 有 末 数 ji， 定义 aq” 为 e， 和 定义 a0 为 aeeed0 与 上 述 推论 是 一 致 的 


推论 33.19 ”如 果 (S， 申 ) 是 一 个 具有 单位 元 e 的 有 限 群 则 对 所 有 aeS，ac) 一 e. 
证 明 : 由 接 格 裔 日 定理 可 知 ordfa) 1 个 |， 因此 S= 0mod 划  ， 其 中 t=ord(ay 


33.4 求解 模 线性 方程 


我 们 现在 来 考 忠 求解 下 列 方 程 的 问题 : 
ab mod mn) (33.22) 

其 中 n>0， 这 是 一 个 很 重要 的 实际 问题 ， 我 们 假设 已 知 a，b 和 n， 我 们 希望 求 出 满足 式 
(33.22] 的 对 模 n 的 工 值 ， 可 能 没有 解 ， 也 可 能 有 一 个 或 光 个 解 . 

设 《ay 表示 由 a 生 成 的 Z, 的 子 群 。 由 于 《a>》 =fa 局 :x> 人 ={farmodn:x>0， 
所 以 方程 【33.22) 有 一 个 解 当 且 仅 当 bE 《ay>。 拉 格 遍 日 定理 (定理 33.15) 告诉 我 们 | 
《3a> | 必定 是 nm 的 约 数 。 下 列 定 理 精 确 地 刻 划 了 《ay 的 特性 。 

定理 33.20 ”对 任意 正 整 数 a 和 na， 如 果 d= gcd(a，m， 则 

《a> =《d》 ={10，d，2d，…，(nxvdy ~- di - {33.23) 

因此 有 
| 《az 1 一 nxd 

证 明 : 我 们 先 证 明 dk 《a>。 注 意 到 EXTENDED~-EUCLID 可 生成 满足 ax'Hnw=d 
的 整数 x 和 y。 因 此，ax'=dmodn)y， 因 而 dcE 《ay。 

由 于 dk 《a>， 所 以 有 的 所 有 倍数 均 属 于 《a>， 这 是 因为 a 的 倍数 的 倍数 仍然 是 a 的 
倍数 。 所 以 《a>》 包含 了 和 集合 {0，d，2d，…:,( (av 由 -1 四 中 的 每 一 个 元 素 。 亦 即 ， 
《dy 三 《a>。 

现在 来 证 明 《 罗 三 《d>。 如 果 mE 《a>， 则 对 某 个 整数 x 有 mm=ax modn， 所 以 对 革 
个 整数 9 有 mm= axHny。 但 是 ， dila 并 且 din， 所 以 根据 式 (33.6) 有 d 问 。 因此 ， mm 所 
《 虽 >。 

由 以 上 这 些 结 论 ， 我 们 有 《ay> =《d>。 为 了 说 明 | 《a> | 一 翌 7 dd 请 注意 在 0 和 n-1 之 
间 恰 有 ay7vd 个 4 的 倍数 《包括 0 和 mn-1)。 

推论 33.21 方程 ax=b( mod n) 对 于 未 知 量 x 有 解 当 且 仅 当 gcdla，m | 

推论 33.22 方程 ax= 王 b( mod n) 或 者 对 模 mn 且 个 不 同 的 解 ， 其 中 d= gcdta，n)， 或 
者 无 解 。 四 

证 明 : 如 果 ax=b( mod n) 有 一 个 解 ， 则 bE 《a>。 根 据 推论 33.18 可 知 对 i= 0，1， 
…， 序 列 ai mnodn 是 一 个 周期 性 序列 ， 其 局 期 为 |《a> 1=nvd。 如果 bE “ay， 则 观 
i=0，1，…，hb 在 序列 aimmodn 中 恰好 出 现 4 次 ， 因 为 当 i 从 0 增加 到 呈 1 时 ， 长 度 头 
nd 的 一 块 值 《a> 恰好 重复 了 dd 次， 这 d 个 位 置 的 下 标 xx 就 是 方程 axsblmodny 的 
解 。 

定理 33.23 设 4= gcd(a，n)， 假 定 对 某 个 整数 x′ 和 y'′， 有 d=ax7* +nay″ (例如 
EXITENDED~-EUCLID 所 计算 出 的 结果 )。 如 果 db， 则 方程 ax==b( mod pn) 有 一 个 解 : 
值 xm， 满 足 
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xo=x” (bd modn 


证 明 : 因为 ax =d(mod n)， 所 以 我 们 有 
ax = 兰 ax(b“ dy (mod ny) 


= dfbyd) mod nm) 
三 (mod Dm) 
因此 x,， 是 方程 ax = btmod n)y 的 解 。 


定理 33.24 ”人 恨 设 方程 ax=b(modn) 有 解 ( 即 有 dlb， 其 中 d=gcd(a，D) ) 并 且 x 是 
该 方程 的 任意 一 个 解 ， 则 该 方程 对 模 n 怡 有 d 个 不 同 的 解 ， 分 别 为 : 国 =xo+in7 d) ， 
1 一 1，2，…，Ud 一 1 

证 明 : 因为 ad>0 并 且 对 ii=0，1，…，d1， 有 0s<sifa d) <n， 所 以 对 模 mn， 值 
x0，Xi，…，Xd_l 都 是 不 相同 的 。 由 序列 aimodn 的 后 期 性 (推论 33.18) 可 知 ， 如 果 az 是 
ax==bl mod nj 的 一 个 解 ， 则 每 个 届 都 是 它 的 解 。 根 据 推论 33.22 可 知 方程 恰 有 dd 个 解 ， 琴 
此 x，xi，…，xu- 必定 是 方程 的 全 部 解 。 

现在 我 们 已 经 为 求解 方程 axsbh(Cmodn)j 作 好 了 数学 上 的 准备 工作 。 下 多 算法 可 打印 
出 该 方程 的 所 有 解 。 输 人 a 和 bb 为 任意 整数 ，n 是 任意 正 整数 ， 


MODPDULAR-LINEAR-EQOUATION 一 SOLYERLa，b，n) 
1 忆 ，x” ,y”) < EXTENPED-EUCLID，Dn) 
2 证 glb 

了 then xx tbyd modan 

4 fier iD to d1 

3 do brint 【x+ifnay dj mod 世 
5 else prnt “ 汪 解 ” 


我 们 举例 说 明 该 过 程 的 操作 ， 考 察 以 下 方程 : 14x=30(mod 100) 《这 里 a= 14， 
b=30，n= 100)。 在 第 1 行 中 调用 EXTENDED-EUCLID 后 得 到 (d，x，y) 三 (2， 一 7， 
1)。 因 为 230， 所 以 执行 第 3-5 行 。 在 第 3 行 ， 我 们 计算 xo= (一 7 〈15) mod 100=95。 第 
4-5 行 的 循环 打印 出 两 个 解 : 95 和 45。 

过 程 MODULAR-LINEAR-- EQUATION- SOLVER 执行 如 下 。 第 1 行 计 算出 
d 一 gcdf(an) 和 两 个 席 足 d=ax”′ +ny ”的 值 x” 和 yy”， 同 时 表明 x”′ 是 方程 ax” = 扩 mod 
nm) 的 一 个 解 。 如 果 d 不 能 被 b 整除 ， 则 由 推论 33.21 可 知 方程 ax=b(modn) 没有 解 。 第 
2 行 检 查 是 否 有 dlb。 如 果 否 ， 则 第 6 行 报告 方程 没有 解 ， 和 否则 第 3 行将 根据 定理 33.23 计 
算出 方 稳 (33.22}》 的 一 个 解 z。 已 知 一 个 解 后 ， 由 定理 33.24 可 知 其 恺 d-1 个 解 可 以 通过 
对 模 n 加 上 (nyvd) 的 倍数 来 得 到 。 第 4-5 行 的 for 循环 打印 出 所 有 d 个 解 ， 对 模 n 从 xe 开 
始 ， 每 两 个 解 之 间 相 差 (ny d).。 

MODULAR-LINEAR-EQUATION-SODLVER 的 运行 时 间 为 执行 DC(18 n+gcd(a， 
n))》 次 算术 运算 的 时 间 ， 因 为 EXTENDED--EUCLID 需要 执行 O( lg nj 次 算术 运算 ， 并 
且 第 4-5 行 for 循环 中 的 每 次 迁 代 均 要 执行 贡 数 次 算术 运算 。 

定理 33.24 的 下 述 推论 说 明了 若干 特殊 情形 。 

推论 33.25 对 任意 n>1， 如 果 ged(a，n]j =1， 则 方程 ab motd 了 对 模 m 有 唯一 
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解 。 
如 果 b= 1， 这 是 我 们 常 遇 到 的 一 种 重要 情形 ， 则 我 们 要 求 的 x 是 a 的 对 模 n 乘法 的 道 
元 素 . 
推论 33.26 ”对 任意 na> 1， 如 果 ged(a，Dn) = 1， 则 方程 
ax==L(inodn) 《33.24) 
对 模 习 有 唯一 解 。 否 则 方程 无 解 。 
推论 33.26 使 得 我 们 在 a 和 了 互 为 质数 时 ， 可 以 用 记号 (a lmod n) 来 表示 a 对 模 n 的 
潜 靶 的 道 元 素 。 如 果 gcdla，n =1， 则 方程 ax=timodm 的 一 个 解 就 是 
EXTENDED-EUCLID 所 返回 的 整数 x， 因 为 方程 
gcd(ta，1) 三 1 一 axHny 
说 明 ay 王 {( mod n) 。 因 此 ， 运 用 EXTENDED-EUCLID 可 以 有 效 地 计算 出 《aimod 


Dj) 


-33.5 中国 余数 定理 


大 约 在 公元 100 年 时 ， 数 学 家 孙子 解决 了 以 下 问题 : 找 出 被 3，5，7 除 时 余数 分 别 为 
2，3 和 2 的 所 有 整数 。 有 一 个 解 为 x=23， 所 有 的 解 是 形 如 23+105k(kk 为 任意 整数 ) 的 整 
数 “ 牛 国 余数 定理 "提出 在 对 每 对 互 为 质数 的 一 组 模 数 〈 如 3，5 和 7) 取 模 运算 的 方程 组 与 


对 其 积 〈 如 105) 取 模 运算 的 方程 之 间 存 在 对 应 关系 。 
中 国 余 数 定 理 有 两 个 主要 作用 。 设 蒜 数 n = nin…ai， 其 中 因子 mi 两 两 互 为 质数 。 首 


先 ， 中 国 余数 定理 基 一 个 描述 性 的 “结构 定理 ”， 它 说 明 工 的 结构 等 同 于 笛 卡 尔 积 Z. 
x Z。 x Z， 的 结构 ， 其 中 在 后 者 中 第 ii 个 组 元 定义 3 对 模 ni 的 组 元 之 间 的 加 法 与 滋 法 运 
短 。 其 次 ， 用 这 种 描述 常常 可 以 获得 有 效 的 算法 ， 这 是 因为 处 理 每 个 系统 Z。 可 能 比 处 理 
模 刀 运算 效率 更 高 〈 指 位 操作 次 数 ) . 
定理 33.27 《中 国 余数 定理 ) ” 设 n = nin…nv， 其 中 m, 每 对 互 为 质数 。 考 虑 下 列 对 应 

关系 : 

at (al，a，…，8,) (33.25) 
其 中 aeZ。， 尖 EZ，。， 并 且 对 ji= 1，2，…。k，a 一 a mod oa ， 则 贞 射 (33.25) 是 一 个 
在 乙 与 笛 卡 尔 集 zu xZ。，x … xzZ， 之 间 的 一 一 对 应 。 对 Z 的 元 素 所 执行 的 运算 ， 
人 人 
的 运算 。 即 如 果 

a<* 《81 ， a.， AN al) 

bb 一 Nbu 
那么 * 

人 +b) mod ne ( (ab) modn…，(a +b) modn ) (33.26) 

但 一 bj) mod n+r 【《 《ai 一 by mod Di， AN， (a 一 b) modn,) 《33.27) 
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(ab) mod ne 《 (aib,) mod ni，…， (ab,) mod mn ，) _ (33.28) 
证 明 : 两 种 表示 之 间 的 变换 是 非常 简单 和 明确 的 。 从 a 转换 为 (a  ，a,，…，a ) 仅 
需 执 行 k 次 除法 运算 。 如 果 运 用 下 列 公式 ， 则 从 输出 (a,，a;，…，a,) 计算 出 a 也 几乎 
一 样 简单 . 设 王 ; =a7ai，i= 1，2，…，k。 注 意 ，mm 一 nin…na_ na …a， 以 使 得 对 
所 有 j 关 i .有 羡 , 三 00nod ni) ， 则 设 
c = 一 mm mod ni) i=1，2，…，k (33.29) 
我 们 就 有 
a 王 (ac 十 ac 十 十 ac (mod n) 《33.301) 
因为 症 和 a, 互 为 质数 (由 定理 33.6) ， 所 以 等 式 (33.29) 有 完备 定义 、 因 此 由 推 


论 33.26 可 知 m (mmod n, ) 有 完备 定义 。 为 了 验证 等 式 (33.30) 成 立 ， 注 意 到 如 果 j 
xi， 则 ec 三 症 三 0(nod n) 并 且 e = (mod n ) 。 我 们 得 到 对 应 关系 

ct (00001050 有 
这 是 一 个 除 第 i 个 坐标 为 1 外 其 余 坐 标 均 为 0 的 向 量 。 因 此 在 某 种 意义 上 说 c 是 这 一 表示 
的 “ 基 ”。 所 以 对 每 个 ji， 我 们 有 

8 二 8iCi (mod n ) 

=ami(m mod n) (mod ni，) 

三 3 ， (mod ni) 

南 于 我 们 能 够 进行 双向 变换 ， 所 以 该 对 应 关系 为 一 一 对 应 关系 。 因 为 对 于 任何 xx 和 

一 1，2，…，k， 有 xmod ni; = (xmod n) mod ni ， 所 以 根据 练习 33.1 一 6 可 直接 推出 
式 〈33.26) 一 (33.28) 成 立 。 


本 章 后 面 的 部 分 将 用 到 下 面 玫 条 推论 ， 
推论 33.28 如 果 ni，n:，…，mnk 两 两 互 质 ,，n= niny…at， 则 对 任意 整 
数 a ，a,，…，a ， 方 程 组 
X 三 aitmod nj) ii 一 1，2，…，kk 


关于 未 知 量 x 对 模 n 有 唯一 解 。 
推论 33.29 ”如 果 D,，nz，…，n 两 两 互 质 ，n = nn …n ， 则 对 所 有 整数 x 和 a 
Xx=atmod mn) ，i 一 1，2，…，k 
当 上 且 仅 当 
X 振 atmod D) 
现在 我 们 举例 说 明 中 国 余数 定理 ， 人 恨 设 我 们 已 知 两 个 方程 : 
a 三 2(mod 5) 
a 三 3(mod 13) 
这 样 a| = 2，n, 一 Im, = 5，a,=3，n, 一 上 ,一 13， 而 nan= 65， 所 以 我 们 希望 计算 
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出 a mod 65。 应 为 
13 ”至 2(mod5) 
s ”三 gmodl13) 
所 以 有 : 
c, 一 13 (2mod5) 一 26 
-一 5 (8modl3) 一 4 
8 三 2 26 二 3 40 (mod65) 
兰 S2 十 120 (med65)} 
三 42 (imod65) 


图 33.3 中 说 明了 对 模 的 的 中 国 余数 定理 的 应 用 。 

因此 ， 如 果 我 们 要 执行 模 mn 运算， 则 我 们 既 可 以 直接 对 模 m 进行 计算 ， 也 可 以 按 我 们 
的 需要 把 模 n 进行 计算 ， 也 可 以 按 我 们 的 需要 把 模 a 表示 进行 变换 ， 再 分 别 对 模 ni 进行 运 
算 处 理 。 这 两 种 计算 过 程 是 完全 等 价 的 。 


33.6 ”元素 的 寡 


正如 我 们 考虑 到 一 个 已 知 元 素 对 模 m 的 倍数 一 样 ， 我 们 常常 自然 地 会 想到 对 模 卫 的 a 
的 宪 组 成 的 序列 ， 其 中 af Z. : 
a8，8a1，a，83，…， (对 模 Dj) (33.31) 


对 其 从 0 开始 编号 ， 则 该 序列 中 的 第 0 个 值 为 atmodn=1， 第 1 个 值 为 amodn。 例 如 ， 对 
模 7，3 的 逢 为 


012345678959 10 1 
3 imod71326451326 4 5 

而 对 挠 7 来 说 2 的 短 为 
0123456789 10 1 


2 mod71241241241 2 4 
在 本 节 中 ， 变 “a7 表示 由 aa 生成 的 Z 的 子 群 ，ord。(kaj 【〈 对 模 m，a 的 次 序 ) 表 
示 a 在 Z， 中 的 次 序 。 例 如 ， 在 Z， 中 , 《2> = {1，2，4}，ord，(2) = 3。 我 们 用 函 
数 ptn) 作为 Z， 的 规模 的 定义 (参见 33.3 节 ) ， 就 可 以 把 推论 33.19 转化 为 用 Z， 来 表 


示 ， 从 而 得 到 欧 拉 定 理 。 如 果 我 们 再 具体 用 乙 ， 来 表示 (p 为 素数 ) ， 我 们 就 得 到 费 马 定 

理 ， 
定理 33.30 ( 欧 拉 定 理 ) ”对 任意 整数 n>1 

有 = ltmod mn) 《33.32) 


对 所 有 aeZ， 都 成 立 。 
定理 33.31 ( 费 马 定理 ) ”如 果 p 是 素数 ， 则 
af ”三 1(modp) (33.33) 
对 所 有 aeZ 都 成 立 。 

证 明 : 根据 等 式 (33.21) ， 如 果 p 是 素数 ， 则 tp) =P 一 1. 

这 个 推论 对 Z, 中 除 0 以 外 的 每 一 个 元 素 都 适用 ， 因 为 0#Z，。 但 是 ， 对 所 有 aeZ，， 
由 果 是 素数 ， 则 有 a = 三 atmod p) 。 

如 果 ord ，(g) = 忆 "|， 则 对 模 n，Z ”中 的 每 个 元 素 都 是 g 的 朝 ， 我 们 就 称 g 是 工 。 
的 原始 根 或 生成 者 。 例 如 ， 对 模 7，3 是 原始 根 。 如 果 乙 ”包含 一 个 原始 根 ， 就 称 群 乙 ” 为 
循环 群 ， 下 列 定理 是 由 Niven 和 Zucketrman 首先 证 明 的 ， 在 此 我 们 略 去 证 明 过 程 。 

定理 33.32 ”对 所 有 的 奇 素数 p 和 所 有 正 整 数 e， 满 足 乙 ， 为 循环 群 的 ntn> 1) 值 
为 2，4，p” 和 2p ， 

如 宁 g 是 Z 的 一 个 原始 根 且 a 是 Z， 中 的 任意 元 素 ， 则 存在 一 个 名 满足 g 
= a(mod n) 。 这 个 z 称 为 对 模 了 到 基 g 上 的 a 的 离散 对 数 或 下 标 ， 其 值 表示 
为 ind,，， (ay 。 

定理 33.33 〈 离 散 对 数 定理 ) ”如 果 g 是 Z. 的 一 个 原始 根 ， 册 等 式 g =E (mod nj) ， 


成 立 ， 当 旧 仅 当 等 式 x=ytmod pfnh) ) 成 立 。 
证 了 明 : 首先 假设 x=.ynod oftn) ) 。 则 对 某 个 整数 有 x=y+ketn) 。 因 此 


了 十 长 可 人 


8 三 车 (mod Ty) 
兰 g” - (gm )Y《mod m) 
三 多 1 (moed my) 
三 多 (mod D) 


相反 地 ， 再 假设 g =g (mod nj 。 因 为 g 的 每 的 序列 生成 《g> 中 的 每 一 个 元 罕 《8B7> 
= 9p(n) ， 因 此 由 推论 33.18 可 知 ，g 的 者 的 序列 是 一 个 周期 为 (tn) 的 周期 性 序列 。 所 以 ， 
如 果 g = 三 g (mod n) ， 必 有 x=yYmod pn) 。 
利用 离散 对 数 有 时 可 以 简化 对 模 运 算 方程 的 讨论 ,这 一 点 从 如 下 定理 的 证 明 中 可 以 看 
出 。 
定理 33.34 如果 PP 是 一 个 奇 素 数 且 e 关 1， 则 方程 
x 1 mod b9) (33.34) 
仅 有 两 个 解 : x=1 和 x=~1。 
证 明 : 设 m=p*。 由 定理 33.32 可 知己 有 一 个 原始 根 g， 从 而 方程 (33.34) 可 以 写成 
(ga 四 ) 三 ge (mod 问 33.39] 
注意 到 ind，(D = 0， 由 定理 33.33 可 知 方程 (33.35) 等 价 于 
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2 ind。， (x) 三 0Otmod on ) ， {33.36) 
为 了 求解 这 个 关于 未 知 量 ind 性 的 方程 ， 我 们 运用 33.4 节 中 的 方法 。 设 d 


= gcd(2，otn) ) = gcd(2， 人 pp 一 1 p”  ) =2， 注 意 有 dl0， 所 以 根据 定理 33.34 我 们 发 
现 方 程 (33.36) 恰 有 d= 2 个 解 。 因 此 ， 方 程 (33.34)} 也 怡 好 有 两 个 解 ， 通 过 观察 可 知 它 
们 应 为 xx=1 和 x= 一 1 

如 果 一 个 数 x 满足 方程 xs==1(modm， 但 x 不 等 于 对 模 来 说 两 个 “平凡 "平方 根 ; 1 
或 -1 中 的 任何 一 个 ， 则 x 是 对 模 m 来 说 !1 的 非 平 凡 平 方 根 。 例 如 ，6 是 对 模 35 来 说 1 的 非 
平凡 平方 根 。 定 理 33.34 的 下 述 推论 将 用 于 我 们 在 33.8 节 中 讨论 的 Miler-Rabin 素数 测试 
过 程 的 正确 性 证 明 中 。 

推论 33.35 ”如 果 对 模 a 存在 1 的 非 平抑 平方 根 ， 则 nm 是 合 数 。 

证 明 : 该 推论 是 定理 33,.34 的 对 照 。 如果 对 模 mn 存在 1 的 非 平 凡 平 方 根 ， 则 hn 不 可 能 是 
素数 或 者 素数 的 蚕 . 0 


运用 反复 平方 法 求 数 的 事 


数论 计算 中 经 常 出 现 的 一 种 运算 就 是 求 一 个 数 的 需 对 另 外 一 个 数 的 模 的 运算 ， 也 称 为 模 
取得。 更 准确 地 说 ， 我 们 希望 找 出 一 种 有 效 方 法 来 计算 a"” mod mn 的 值 ， 其 中 a，b 为 非 负 
整数 ，n 是 正 整 数 。 在 许多 素数 测试 子 程序 和 RSA 公开 密 包 加 密 系 统 中 ， 模 取 春 运算 也 是 
一 种 很 重要 的 运算 。 当 用 二 进 制 来 表示 b 时 ， 采 用 反复 平方 法 可 以 有 效 地 解决 这 类 问题 ， 

设 《b,，bki，…，bi，bo> 是 b 的 二 进 制 表示 〈 即 二 进 制 表示 有 krl 位 长 ，bs 为 最 高 
有 效 位 ，be 为 最 低 有 效 位 )， 下 列 过 程 随 著 的 值 从 0 到 b 成 倍增 加 ， 最 终 计算 出 


ac imod Tn。 


MODPULAR-EXPONENTIATIONU，b，nm) 


1 ee 全 

2 < 
3 设 《b，bh ，…，hbo> 是 b 的 二 进 制 表示 
4 foef in downto 昌 

5 dp ee 2 

6 d< (dd inodn 

7 让 bi=1 

8 then CeC+l 

9 本 < 人- aj Todaa 
10retrun 革 


依次 计算 出 的 每 个 萌 或 者 是 前 面 一 个 需 的 两 倍 ， 或 者 比 前 面 一 个 者 大 1; 过 程 从 右 到 左 
恶 个 读 人 b 的 二 进 制 表示 以 控制 执行 哪 一 种 操作 。 循环 中 的 每 次 选 代 都 用 到 了 下 面 两 个 恒 
等 式 中 的 一 个 : 

amodn= (fa “modn 
a2cttmodn 一 afac ?modn 
几 哪 一 个 等 式 要 取决 于 bi=04 或 1。 由 于 平方 在 每 次 从 代 中 起 着 关键 必用， 所 以 这 种 方法 取 
名 为 “反复 平方 *。 在 读 人 b, 位 并 进行 相应 处 理 后 ，c 的 值 与 的 二 进 制 表示 《bk，by )， 
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…，bo>》 的 前 级 值 相同 。 例 如 ， 当 a=? 了 ，b=560= 《10000.1 0000》，n= 561 时 ， 算 法 计算 
出 的 对 模 S61 相应 值 的 序列 如 图 33.4 所 未 ; 其 中 用 到 的 需 的 序列 见 者 中 上 c 行 。 


外 了 和 5 4 3 2 ] 避 
必 性 0 】 1 0 0 必 0 
了 才 8 17 35 70 140 2830 4060 
49 157 5S206 160 24 298 160 67 ] 


司 33.4 用 MODULAR-EXPONENTIATION 计算 ao(medn) 的 结果 


实际 上 ， 算 法 并 不 真正 需要 变量 c， 只 是 为 了 说 明 起 见 我 们 才 设 置 了 变量 c: 当 e 成 倍 
增加 时 算法 保持 条 件 4=as modn 不 变 , 直至 c=b。 如 果 输 和 人 a，b 和 jn 是 有 位 的 数 ， 则 算 
法 总 共 需 要 执行 的 算术 运算 次 数 为 DLP)， 总 共 需 要 执行 的 位 操作 次 数 为 Q(p83) 。 


33.7 RSA 公开 密 钥 加 密 系 统 


公开 密 锅 加 密 系 统 可 用 于 对 传输 于 两 个 通讯 单位 之 间 的 信息 进行 加 密 ， 这 样 即 使 窃听 者 
窃听 到 被 加 窒 的 信息 ， 也 不 能 对 加 密 信 息 进 行 破译 。 公 开 密 钥 加 密 系 统 还 能 够 使 通讯 的 一 方 
在 电讯 的 末尾 附 雪 一 个 无 法 伪 遗 的 “数字 签名 "。 这 种 签名 是 对 文件 上 的 手写 敌 名 的 电子 模 
扳 。 任 何人 都 可 以 容易 地 核对 这 一 签名 ， 但 却 无 人 能 够 擅 造 ， 因 为 如 果 这 一 信息 中 的 任何 位 
直 所 变化 ， 整 个 签名 就 失去 了 其 效力 。 因 此 ， 数 字 签 名 可 以 作为 确认 签名 者 和 其 签署 的 信息 
内 容 的 -种 证 明 。 这 对 于 电子 签署 的 商业 性 合同、 电子 支票 、 电 子 购 买 定货 单 和 其 他 一 些 必 
须 经 过 证 实 的 电子 信息 来 说 是 一 种 理想 的 工具 。 

RSA 公开 密 铀 加 密 系 统 主 要 基于 以 下 事实 : 寻求 大 素数 是 很 容易 的 ， 但 要 把 一 个 数 分 
解 为 两 个 大 素数 的 积 却 是 相当 困难 的 。33.8 节 中 讲述 一 个 可 能 效 地 找 出 大 素数 的 过 程 ，33.9 
节 中 将 讨论 大 整数 的 分 解 问题 。 


公开 密 钥 加 密 系统 


在 会 开 密 钥 加 密 系 统 中 ， 每 个 参加 者 都 用 一 把 公开 密 铀 和 一 把 机 密 密 铀 每 把 密 钥 都 是 
一 条 信息 。 例 如 ， 在 RSA 公开 密 铀 加 密 系 统 中 ， 每 把 密 铀 均 是 由 一 对 整数 组 成 ， 在 密码 学 
中 常 把 参加 者 “Alice” 和 “Bob” 作 为 例子 : 我 们 用 Ps。 和 S。 分 别 表示 Alice 的 公开 密 铀 和 机 窗 
密 铀 ， 用 Pa 和 Se 分 别 表 示 Bob 的 公开 密 钥 和 机 密 密 铀 。 

每 个 参加 者 均 自 己 创建 其 公开 密 钥 与 机 密 密 钥 ， 但 要 对 其 机 密 密 钥 保密 ， 而 公用 密 钥 则 
可 以 对 任何 人 公开 或 干脆 公之于众。 事实 上， 如 果 每 个 参加 者 的 公开 密 铀 都 能 在 一 个 公开 目 
录 中 查 到 将 是 很 方便 的 ， 这 样 就 能 使 任何 参加 者 容易 地 获得 任何 其 他 参加 者 的 公开 密 铀 。 

公开 密 铀 和 机 密 密 钥 指明 可 适用 于 任何 信息 的 功能 函数 。 设 D 表示 允许 的 信息 集合 。 
例如 ， 了 p 可 能 是 所 有 有 限 位 序列 的 集合 ， 我 们 要 求 公 开 密 铀 与 机 密 铀 匙 说 明 一 种 从 D 到 其 
自身 的 一 一 对 应 的 函数 。 对 应 于 Alice 的 公开 密 钥 P。 的 函数 用 产品 表示 ， 对 应 于 她 的 机 密 
密 钥 S。 的 函数 表示 成 SA0。 因 此 PsO 与 SA0O 函 数 是 D 的 排列 。 我 们 假定 如 果 已 知 密 铀 P, 
或 S。 就 能 够 有 效 地 计算 出 函数 PsO 和 SO0O。 
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任何 参加 者 的 公开 密 铀 和 机 密 密 铝 都 是 一 个 “匹配 对 "， 它 们 指定 的 函数 互 为 反 范 数 。 亦 
即 , 对 任意 信息 MED， 有 
M=S(P,(M)) (33.37) 
M=P,(S (MD)) 033.38) 
不 论 用 哪 一 种 次 序 ， 运 用 两 把 密 铀 P 和 S。 对 M 相继 进行 变换 后 ， 最 后 仍然 得 到 信息 
M. 
在 会 开 密 钥 加 密 系 统 中 ， 重 要 的 是 除 Alice 外 没有 人 能 在 较 短 的 时 间 内 计算 出 函数 
SA0。 送 给 Alice 加 密 邮 件 的 保密 程度 与 对 Alice 的 数字 乱 明 的 证 明 均 依赖 于 以 下 假设 ; 只 
有 Alice 能 够 计算 出 S 人 ) 。 这 个 要 求 也 是 Alice 要 对 S$S, 保密 的 原因 ; 如 果 好 不 能 做 到 这 一 
点 ， 就 会 失去 她 的 唯一 性 特性 ， 因 而 加 审 系 统 也 就 不 能 把 唯一 性 能 力 赋予 她 ， 即 使 每 个 人 都 
知道 P。 并 且 能 够 有 效 地 计算 出 Sas0 的 反 晒 数 Ps(O， 我 们 依然 必须 保持 只 有 Alice 能 够 计 
算出 SO 的 假设 成 立 。 设 计 一 个 可 行 的 公开 审 钥 加 密 系 统 的 主要 困难 在 于 解决 如 下 问题 : 
如 和 何 创建 一 个 系统 ， 在 该 系统 中 我 们 可 以 公开 其 变换 Ps OO ,而 不 致 于 因此 而 公开 计算 其 相 
应 的 站 变换 S.0 的 方法 . 
在 公开 密 铀 加 蜜 系统 中 ， 按 下 列 公 了 式 进 行 加 密 。 银 定 Bob 希望 给 Alice 发 一 条 加 密 信息 
M， 使 得 该 信息 对 于 窃听 者 听 起 来 像 一 串 无 意义 的 话 ， 发 送信 息 的 方案 如 下 : 
-Bob 取得 Alice 的 公开 密 钥 Ps 根据 一 个 公开 的 目录 或 直接 向 Alice 索取 ), 
. Bob 计算 出 相应 于 M 的 密码 报 文 .C=P(M) 并 把 C 发 送 给 Alice。 
- 当 Alice 收 到 密码 报 文 C 后 ， 她 运用 自已 的 机 密 密 铀 恢复 出 原始 信息 : M= SA(C). 
图 33.5 说 明了 这 一 过 程 。 因 为 SaAO 和 PaA0 互 为 反 数 ， 所 以 Alice 能 够 根据 C 计算 
出 M，。 丙 为 只 有 Alice 能 驶 计算 出 SO， 所 以 地 只 有 Alice 能 根据 C 计算 出 M。 运用 P.O 
对 M 进行 加 密 可 以 使 M 的 内 容 不 会 酒 露 给 除 Alice 以 外 的 任何 人 。 





C = PC1) 


图 33.5 公开 钥匙 系统 的 加 密 过 程 


类 似 地 ， 在 公开 密 钥 加 密 系 统 中 可 以 很 容易 地 实现 数字 签名 。 恨 设 现在 Alice 希望 把 一 
个 数字 签署 的 回答 M '′ 发 送 给 Bob。 数 字 签 名 的 过 程 如 下 : 
.Alice 运用 她 的 机 密 密 钥 S。 计算 出 信息 M ′ 的 数字 签名 = Sa(M  )。 
Alice 把 该 信息 7/ 签名 对 (M ”′,a) 发 送 给 Bob。 
: 当 Bob 收 到 (M ”′，a) 时 ， 他 可 以 利用 Alice 的 公开 密 钥 通 过 验证 等 式 M′= Pu(e] 
来 证 实 该 信息 的 确 是 Aliee 发 出 的 《假设 MX '′ 包含 有 Alice 的 名 字 ， 这 样 Bob 就 知道 
庶 该 使 用 谁 的 公开 审 铀 ) 。 如 果 等 式 不 成 立 ， 那 么 Bob 就 得 出 结论 ， 要 么 是 信息 
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M “或 数字 签名 c 在 信息 传输 过 程 中 有 误 ， 要 人 么 信息 对 (M ”′，e) 就 是 一 个 有 意 的 念 
造 。 图 33.6 说 明了 上 述 过 程 。 因为 数字 签名 既是 对 签署 者 身份 的 证 明 , 也 是 对 所 签署 
的 信息 内 容 的 证 明 ， 所 以 它 是 对 文件 末尾 的 手写 篮 名 的 一 种 模拟 . 


羡 1ice  ， Bob 





sien VSTity 
他 


图 33.6 人 冬 用 锂 是 系统 中 的 数字 签名 


数字 签名 的 一 条 重要 性 质 就 是 它 可 以 被 任何 能 取得 签署 者 公开 密 铀 的 人 所 验证 。 一 条 签 
署 过 的 信息 可 以 被 一 方 确 认 后 再 传送 到 其 他 各 方 ， 他 们 世 同 样 能 对 该 得 名 进行 验证 。 例 如 ， 
这 条 信息 可 能 是 Alice 发 送 给 Bob 的 一 张 电子 支 奈 。 当 Bob 确认 了 支票 上 Alice 的 签名 后 ， 
他 可 以 把 这 张 支 票 送 交 银行 ， 而 银行 也 可 以 对 签名 进行 验证 ， 然 后 调拨 相应 的 资金 。 

注意 ， 被 答 署 的 信息 并 没有 加 密 ， 该 信息 是 “公开 的 *。 没 有 受到 保护 。 如 果 把 上 述 有 关 
加 密 和 签名 的 两 种 方案 结合 起 来 使 用 ， 我 们 就 可 以 构造 同时 被 签署 并 加 密 的 信息 。 签 署 者 首 
先 把 他 的 数字 签名 附加 在 信息 后 面 ， 然 后 再 用 他 希望 的 接受 者 的 公开 密 钥 对 得 到 的 信息 7/ 签 
名 对 进行 加 密 。 接 受 者 运用 他 的 机 蜜 钥匙 对 收 到 的 信息 进行 解密 以 同时 获得 原始 信息 和 数字 
签名 , 然后 他 可 以 用 签署 者 的 公开 密 钥 对 签名 进行 验证 。 在 日 带 的 纸张 文件 系统 相应 的 过 程 
为 : 对 文件 签名 后 。 把 文件 封 人 一 个 纸 质 信封 内 ， 该 信封 只 能 由 希望 的 接受 者 打开 。 


RSA 加 密 系 统 
在 RSA 公开 密 钥 加 密 系 统 中 ， 一 个 参加 者 按 下 列 过 程 来 创建 他 的 公开 密 钥 与 机 审 密 


1. 随机 选取 两 个 大 素数 p 和 9q， 例 如 ， 索 数 p 和 q 可 能 各 有 100 位 《十进制 数 ) 。 

2. 根据 式 n= pq 计算 出 n 的 值 。 

3. 选取 一 个 与 own)j 互 为 质数 的 小 奇数 e， 其 中 根据 等 式 〈33.20) 可 知 pm =(p 一 1 

(q 一 1 。 

4.， 对 模 ptn)， 计 算出 e 的 匀 法 道 元 素 d 的 值 (推论 33.26 保 证 d 存 在 并 且 唯 一 )。 

5. 公开 对 P= (e，m 巾 ， 并 把 它 作为 RSA 公 开 密 铀 。 

6 把 对 S=(d，Dn) 进行 保 岂 ， 并 把 它 作为 RSA 机 密 密 铀 。 

对 这 个 方案 来 说 ， 域 D 为 集合 Z,. 公开 密 铀 PP 一 (e，D) 相关 联 的 信息 M 的 变换 
与: 


RPM) =Mef maodn) 《33.39) 
与 机 密 密 铀 S= (d，m) 相关 联 的 密码 报 文 C 的 相 庶 变 换 为 : 
StC) =CcCmodn) (33.40) 


这 两 个 等 式 对 加 密 与 签名 都 通用。 为 了 创建 一 个 签名 ， 和 签署 人 把 其 机 密 密 钥 应 用 于 黎 署 
的 信息 而 不 是 密码 报 文 。 为 了 确认 签名 ， 可 以 对 短 名 而 厅 是 对 被 加 密 的 信息 应 用 签署 人 的 公 
开 密 钥 。 

我 们 可 以 运 33.6 节 中 描述 的 过 程 MODULAR-EXPONENTIATION 来 实现 上 述 公开 
密 钥 与 机 密 密 钥 的 有 关 操 作 。 为 了 分 析 这 些 操 作 的 运行 时 间 ， 候 定 公开 密 铀 (e，Dn) 和 机 蜜 . 
密 钥 (d，n) 满足 : 外 =OG)，Id= 思 =8， 则 实施 公开 密 钥 操 作 需 要 执行 OQ(1) 次 模 乘 法 
运算 和 Op ) 次 位 操作 。 实施 机 密 密 铀 操作 需要 执行 OC(8) 次 模 乘 法 运算 和 O(83) 次 位 操 
作 。 ， . 

定理 33.36 (RSA 的 正确 性 ) RSA 等 式 (33.39) 和 (33.40) 定义 了 满足 等 式 
(33.37) 和 (33.38) 的 Z, 上 的 互 道 变换 ， 

证 明 : 根据 等 式 (33.39] 与 《33.40) ， 我 们 有 对 任意 ME Z，P(S(IM) = SOP(MD) 
=RMed(imod ny 。 

由 于 e 和 1d 是 关于 模 p(n) =(p-1) (q-JD 的 习 法 的 道 ， 所 以 对 某 个 整数 k，、 有 

ed 一 1+Kkp-1) (q 一 1 

但 是 如果 M 天 0(mod P)， 根据 定理 33.31 有 


M” =MM? )“ ”mod p) 
三 MD 和 -1 (mod P) 
三 M (mod D) 


同样 ， 如 果 M = 0mod B) ， 则 也 有 M"”=Mmod p) . 

因此 ， 对 所 有 M， 有 MY” = M(mod p) 

类 似 地 ,对 所 有 M， 有 MY” = Mtmeod dg) 

所 以 ， 根 据 中 国 余数 定理 的 推论 33.29， 对 所 有 M， 都 有 M%4 三 Mtmod mm。 

RSA 加 密 系 统 的 安全 人 性 主要 来 源 于 对 大 整数 进行 因子 分 解 的 困难 性 。 如 果 对 方 能 对 公 
开 密 铺 中 的 模 n 进行 分 解 ， 他 就 可 以 报 据 公 开 密 钥 推导 出 机 窗 密 钥 ， 并 可 以 与 公开 窗 铀 的 
创建 者 用 一 样 的 方法 来 运用 因子 :p 和 q。 因 此 如 果 能 够 容易 地 分 解 大 整数 ， 也 就 能 够 容易 地 
打 殴 RSA 加 密 系 统 。 如 果 不 容易 分 解 大 整数 ， 则 不 容易 打破 RSA。 刻 今 为 止 ， 人 们 还 没有 
发 现 比分 解 模 m 更 容易 的 方法 来 打破 RSA 公开 窗 钥 加 蜜 系统。 并且 正 如 我 们 将 在 33.9 节 中 
独到 的 那样 ， 对 大 整数 进行 分 解 的 困难 程度 令 人 惊异 。 通 过 随机 地 选取 两 个 100 位 的 素数 并 
求 出 它们 的 积 ， 我 们 就 可 以 创建 出 一 把 用 现行 技术 无 法 在 可 行 的 时 间 “ 打 破 "的 公开 密 铀 。 在 
目前 数论 算法 的 设计 方法 还 没有 根本 突 玖 的 条 件 下 ，RSA 加 密 系 统 可 以 为 实际 应 用 提供 高 
度 的 安全 性 。 

. 为 了 通过 RSA 加 密 系 统 获得 安全 性 ， 有 必要 处 理 一 些 长 度 为 100-200 位 的 整数 ， 因 为 
对 小 整数 的 分 解 是 不 切实 际 的 。 在 特定 情况 下 ，、 为 创建 必要 长 度 的 密 铀 ， 我 们 必须 能 够 有 效 
地 投 出 大 素数 .这 一 问题 留 到 33.8 节 中 再 详细 论述 。 

为 了 提高 效率 ， 常 常 运用 一 种 “混合 的 "或 “ 密 钥 管理 "模式 的 RSA 来 实现 快速 的 无 公开 
密 钥 加 密 系 统 。 在 这 样 一 个 系统 中 ， 加 密 密 钥 与 解密 密 钥 是 相同 的 。 如 果 Alice 希望 私下 把 
一 条 很 长 的 信息 M 发 送 给 Bob， 在 无 公开 钥匙 加 密 系 统 中 ， 她 选取 一 把 随机 密 铀 玉 ， 然 后 
运用 及 对 M 进行 加 密 ， 得 到 密码 报 文 C。 这 里 C 和 M 一 样 长 但 K 是 相当 短 的 。 然 后 她 
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利用 Bob 的 公开 RSA 密 钥 对 玫 进行 如 密 。 因 为 天 很 短 ， 所 以 计算 Petk) 的 速度 也 很 快 
( 比 计算 Pa(MD 的 速度 快 很 多 )。 然 后 ， 她 把 〈C，Pa(K)) 传送 给 Bob，Bob 对 Pa(K) 解 
沉 后 得 到 玉 ， 然 后 夷 用 用 对 C 进行 解 密 从 而 得 到 M。 

类 似 地 ， 我 们 也 经 常 使 用 一 种 “混合 的 "的 方法 来 提高 数字 签名 的 执行 效率 。 在 这 种 方法 
中 ， 我 们 使 RSA 与 一 个 公开 的 单 向 散 列 画 数 h 相 结 合 ， 其 中 的 单 向 散 列 函数 是 易于 计算 
的 ， 但 对 这 种 函数 来 说 ， 要 找 出 两 条 信息 M 和 了 M ”满足 h(M) =hOM”′)， 这 在 计算 上 
是 不 可 行 的 。 如 果 Alice 希望 签署 一 条 信息 M， 好 首先 把 函数 h 作用 于 M 得 到 指 丝 
h(M) ， 然 后 她 用 机 密 密 钢 签名 后 把 〈M，SaA(h(M) )) 作为 她 签署 的 M 的 版 本 发 送 给 
Bob，、，Bob 可 以 通过 计算 hb(MD) ， 然 后 验证 用 P, 作用 于 他 收 到 的 Ss(h(M)) , 看 是 否 等 于 
h(M 来 证 实 签 名 的 趴 实 性 。 因 为 没有 人 能 够 构造 出 具有 相同 指纹 的 两 条 信息 ， 所 以 不 可 能 
既 改 变 了 签署 的 信息 六 能 保持 签名 的 合法 性 。 

最 后 ， 我 们 注意 到 利用 证 明 书 可 以 更 容易 地 分 配 公 开 密 铀 。 例 如 ， 假 设 存在 一 个 “可 信 
任 的 权 感 "T， 每 个 人 都 知道 他 的 公开 密 铀 。Alice 可 以 从 了 获取 一 条 签署 的 信息 《她 的 证 明 
“Alice 的 公开 密 钥 是 Ps"。 由 于 每 个 人 都 知道 P+， 所 以 这 个 证 明 书 是 一 个 “自我 证 
入。Aliice 可 以 把 好 的 证 明 书 包含 在 签名 信息 中 ， 这 样 就 可 以 使 接受 者 立即 得 到 Alice 的 公 
政 密 钥 , 以 便 验证 她 的 签名 。 因 为 她 的 密 铀 是 被 工人 签署 的 ， 所 以 接受 者 就 知道 A Alice 的 密 钥 
将 实 是 Alice 本 人 的 密 铀 。 


33 .8 素数 的 测试 


在 本 节 中 我 们 要 考虑 寻 投 大 素数 的 问题 。 我 们 先 讨 论 索 数 的 密度 ， 接 着 讨论 一 种 似乎 
F 行 的 《但 不 完全 的 ) 测试 素数 的 方法 ， 最 后 介绍 由 Miler 和 Rabin 发 现 的 有 将 的 随机 素 
+ 测试 算法 。 


素数 的 密度 


在 很 多 闻 用 领域 〈( 如 密码 学 ) 中 ， 我 们 需要 找 出 大 的 “随机 "素数 。 笠 运 的 是 ， 大 素数 并 
不 算 太 少 ， 因 此 测试 适当 大 的 随机 整数 直至 找到 素数 的 过 程 也 不 是 太 费 时 的 。 素 数 分 布 函 数 
rtn)j 说 明了 小 于 或 等 于 nm 的 索 数 的 数目 ， 例 如 xfl0) =4， 玉 为 小 于 或 等 于 10 的 素数 有 4 
个 ， 分 别 为 2，3，5 和 了。 素数 定理 给 出 的 xfn)j 的 一 种 有 用 的 近似 计算 方法 。 

定理 33.37 (素数 定理 ) 

1 Fn) 一 
xn inn 

即使 对 于 较 小 的 nn， 近似 计算 式 ninn 可 以 给 出 xftn) 的 相当 精确 的 估计 值 。 例 姐 ， 
当 n=10 时 ， 其 误差 不 超过 6%， 这 时 rfn) =50 847 478， 而 ninn=48 254 942 (对 
研究 数论 的 人 来 说 ，10" 是 一 个 小 数字 ) 。 

运用 素数 定理 可 以 估计 出 一 个 随机 选取 的 整数 n 是 素数 的 概率 为 17lnn。 因此， 为 了 
找 出 一 个 长 弃 与 nm 相同 的 素数 ， 皂 们 大 药 要 检查 在 nm 附近 随机 选取 的 in nm 个 整数 。 例 如 ， 
为 了 找 出 一 个 100 位 长 的 素数 ， 大 约 需 要 对 ln 10 色 = 230 个 随机 选取 的 100 位 长 的 整数 进 
行 素数 性 测试 (我们 通过 只 选择 奇数 就 可 以 把 这 个 数字 减少 一 半 )。 
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在 本 节 剩 让 的 部 分 中 ， 我 们 来 考虑 确定 一 个 大 的 奇数 mn 是 否 是 素数 的 问题 ， 为 了 表示 
上 的 方便 ， 假 定 n 县 有 下 列 素 数 分 解 因子 : 


ee ET 


一 虽 ，P。…P， 《33.417 
其 中 r21 并 且 bp，p，…，pP, 是 mn 的 素数 因子 。 当 然 ,nm 是 素数 当 且 仅 当 n=1 并 有 
一 1 二。 

解决 这 个 问题 素数 测试 问题 的 一 种 简便 方法 是 试 除 。 我 们 试 着 用 每 个 整数 2，3，…， 
LVnl 分 别 去 除 nm (大 了 于 2 的 偶数 可 以 跳 过 )。 很 容易 看 出 , n 是 素数 当 百 仅 当 没有 一 个 试 除 
数 能 被 n 整除 。 假 定 等 次 试用 除 需 要 常数 时 间 ， 则 最 坏 情 况 下 运行 时 间 为 @Vn )， 这 是 ma 的 
长 度 的 算 〈 阿 顾 一 人 下， 如 果 m 表示 成 有 位 的 一 进 制 数 ， 则 8= Tig (nt 1， 因 此 Mn 
=@(217 2))。 因 此 ， 只 有 当 nm 很 小 或 者 mn 恰好 有 一 个 较 小 的 素数 因子 时 ， 试 除法 才能 较 好 
地 执行 。 当 执行 试 除法 时 ， 它 的 优点 是 它 不 仅 能 确定 n 是 素数 还 是 合 数 ， 而 且 当 了 是 合 数 
时 ， 它 实际 上 确定 出 了 nm 的 素数 因子 分 解 。 

在 本 节 中 我 们 所 感 兴趣 的 仅仅 是 确定 一 个 指定 的 数 n 是 否 是 素数 ; 如 果 了 是 一 个 合 
数 ， 我 们 将 不 涉及 其 素数 因 季 分 解 的 问题 。 正 如 我 们 将 在 33.9 节 中 将 要 看 到 的 那样 ， 计 算 
一 个 数 的 素数 因子 分 解 的 计算 过 程 的 代价 是 高 昂 的 。 令 人 惊异 的 是 , 确定 一 个 数 是 否 是 素数 
要 比 确定 一 个 合 数 的 索 数 因子 分 解 容 易 得 多 。 


伪 素 数 测试 过 程 
现在 我 们 来 考察 一 种 “几乎 可 行 " 的 素数 测试 方法 ， 事 实 上 ， 这 种 方法 对 很 多 实际 应 用 来 
说 已 是 一 种 相当 好 的 方法 。 我 们 以 后 将 对 该 方法 作 糖 心 的 改进 以 消除 其 中 存在 的 小 的 人 缺陷。 
设 Z ”表示 乙 , 中 的 非 零 元 素 : 
Z =11，2，…，n 一 二 
如 果 n 是 素数 ， 则 Z ”= Z 。 
如 果 n 是 一 个 合 
a" 三 1(mod D] (33.42) 
则 说 n 是 一 个 基于 a 的 伪 素 数 。 费 马 定理 【定理 33.31) 说 明 如 果 是 一 个 素数 ， 则 对 Z 
中 的 每 一 个 a， 满足 等 式 (33.42) 。 困 些 ， 如 果 我 们 能 找 出 满足 条 件 a 不 满足 等 
式 《33.42) 的 任意 asZ。， 那 么 n 当然 就 是 合 数 。 令 人 惊异 的 是 ， 这 个 命题 的 道 命题 也 几 
乎 成 立 、 因 此 这 一 衡量 慰 准 儿 乎 是 素数 测试 的 正确 标准 。 我 们 测试 看 看 对 a = 2，n 是 否 满 
是 等 式 (33.42) ， 旭 果 不 满 足 ， 则 可 以 说 是 合 数 ， 否 则 ， 我 们 输出 一 个 猜想 : n 是 素 
数 《实际 上 ， 此 时 我 们 所 知道 的 只 是 na 或 者 是 素数 或 者 是 基于 2 的 伪 素 数 ) 。 


. 不 列 过 程 就 是 用 这 种 方式 伪 球 数 的 测试 过 程 。 它 利用 了 33.6 节 中 讨论 的 过 


程 MODULAR -- EXPONENTIATION。 人 假设 输入 am 是 一 个 大 于 2 的 整数 。 
PSEDOPRIME(n) 
tL if MODULAR-EXPONENTIATION(C2，n 一 1，nm 天 人 攻 mod tn) 
3 ， then return 合 数 ， 确 下 地 
3 else teturn 秦 数 我 们 希望 
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这 个 过 程 只 会 产生 一 种 类 型 的 错误 。 如 果 它 判定 mn 是 合 数 ， 则 结果 总 是 正确 的 。 但 
是 ， 媳 果 它 类 定 n 是 崇 数 ， 那 么 只 有 当 m 是 基于 2 的 伪 素 数 时 过 程 才 会 出 错 ， 

这 个 过 程 出 错 的 几率 有 有 多大? 它 出 错 的 机 会 非常 少 。 在 小 于 10000 的 mn 值 中 只 有 在 其 
中 22 个 秆 会 产生 错误 ， 前 面 四 个 这 样 的 值 分 别 为 : 341，561，645 和 1105。 可 以 证 明 当 有 
-sc 时 ， 该 过 程 对 随机 选 反 的 有 位 数 进 行 测 试 时 发 生 错误 的 和 概率 赵 于 0。 如果 我 们 像 
Pomeranee 那样 对 给 定 规模 的 基 十 2 的 伪 素 数 的 数目 能 作出 更 加 精 确 的 估计 ， 我 们 就 可 以 得 
出 被 上 述 过 程 称 为 者 数 的 一 个 随机 选取 的 50 位 数 , 是 基于 2 的 伪 素 数 的 概率 不 到 100 万 分 之 
一 、 而 被 上 述 过 程 称 为 雪 数 的 一 个 随机 选取 的 100 位 数 , 是 基于 2 的 伪 素 数 的 概率 不 到 
1073。 

遗 慷 的 十， 我 们 不 能 仅 通 过 选取 另外 一 个 基数 ， 例 如 a= 3， 检 查 等 式 (33.42) 的 方法 
来 消除 所 有 的 出 错 机 会 ， 这 是 因为 对 所 有 a5 Z，， 总 存在 满足 等 式 (33.42) 的 合 数 n。 这 
些 整 数 被 称 为 Carmichael 数 。 前 二 个 Carmichael 数 是 S61，1105 和 1729。 Carmichael 数 
是 非 钟 少 的 ， 倒 ， 在 小 于 100 000 000 的 数 中 ， 只 有 255 个 Carmichael 数 ， 练 习 33.8-2 解 
释 了 这 种 数 很 少 的 原因 。 

一步 我 们 米 说 而 如 何 对 素数 测试 方法 进行 改进 以 使 测试 过 程 不 会 把 Carmichael 数 当 
成 素数 。 


Miiller 一 妨 abin 随机 性 素数 测试 方法 


Miller 一 Rabin 素数 测试 方法 对 简单 测试 过 程 PSEUDOPRIME 进行 了 两 点 改进 ， 从 而 
解 次 子 其 中 在 在 的 站 是: 
区 试 验 了 数 个 随和 机 选取 的 基 值 a, 而 不 蚌 仅 仅 试 验 一 个 基 什 . 
- 当 让 说 毕 个 模 取 短 的 值 时 ， 它 注意 是 否 发 现 了 对 模 n 来 说 1 的 非 平凡 平方 根 。 如 果 发 
现 这 样 的 根 存在 ， 终 下 执行 并 葵 岂 结果 为 合 数 。 推 论 33.35 说 明了 用 这 种 方法 检测 出 
合 数 是 正 确 的 
直人 凡是 Miller 一 Rabin 过 数 测试 的 代码 。 输 入 n>2 是 一 个 订 数 ， 过 程 将 测试 它 是 否 为 素 
数 ，S 是 从 Z ”中 随机 选取 的 要 进行 试验 的 基 值 的 个 数 。 代 码 中 运用 了 8.3 节 中 讨论 过 的 随 
机 数 生成 程序 RANDOM: RANDOM(II，n-l) 返回 一 个 满足 1 么 a 委 n-1 的 随机 选取 的 整 
数 4， 代码 中 还 使 用 -个 辅助 过 程 WwWITNESS，WITNESS(a，n) 为 TRUE 当 旦 仅 当 a 是 
合 数 的 "HH 背 ” 印 用 a 来 证 明 (其 证 明 方 法 我 们 将 会 看 到 ) n 是 合 数 是 可 能 的 。 测 试 
WITNESSI，D)j 炎 似 上 作为 过 程 PSEUDOPRIME 的 基础 (用 a=2) 的 测试 
2 天 Hinodn) 
但 并 个 比 后 者 更 有 效 。 我 们 首先 昌 介 绍 并 证 明 一 下 WITNESS 的 构造 过 程 ， 然 后 说 明 如 何 
拒 它 座 骨 十 Miller 一 Rabin 素数 测试 过 程 。 





WwWITNESSGa，mT) 

1 证 “hi， bi，…。，bu>》 是 mn-]1 的 二 进 制 表 示 
> Una 1l 

3 ter i 攻 downion 
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二 dm xn 呈 

S de 刀 :d modn 

和 让 太 二 1 an Xi and xn 一 ] 
了 then Fetutm TRUE 

8 这 上 =] ， 

9 then dt -al modn 


tt 记 二 1 
1 then Teturnm 工具 TD 
12 return 下 ALSE 


上 述 伪 代码 是 以 过 程 MODULAR-EXPONENTIATION 的 的 代码 为 基础 的 ,第 1 行 
确定 了 nm-1 的 一 进 岗 表示 ， 它 将 用 于 求 a 的 nt 次 宪 。 第 3-9 行 计算 出 4a=ar modn。 所 
使 用 的 方法 与 过 程 MODULAR-EXPONENTLON 中 使 用 的 方法 相同 。 但 是 ， 每 当 执 行 第 
5 行 中 的 求 平 方 运算 时 ， 第 6-7 行 检查 是 否 已 发 现 1 的 非 平凡 平方 根 。 如 果 发 现 这 样 的 根 存 
在 ， 算 法 终止 执行 并 返回 TRUE。 在 第 10-11 行 中 ， 如 果 计 算出 的 ar moed n 关 1， 则 过 程 
返回 TRUE， 这 就 正如 过 程 PSEUDOPRIME 在 这 种 情况 下 返回 合 数 一 样 。 

现在 我 们 来 论证 如 果 WIJITNESS(a，n) 返回 TRUE， 则 可 以 用 a 构造 出 mn 是 合 数 的 证 
胡 过 程 . 

如 果 WITNESS 从 第 11 行 返回 TRUE， 则 它 已 发 现 d= an mod hn 夫 1。 但 是 ， 如 果 n 
是 素数 ， 则 根据 费 马 定理 《定理 33.31) 有 对 任何 aCZ，，an :一 (modn) 成 立 。 因 此 ，a 
不 可 能 为 素数 ， 并 且 等 式 amod n- 关 1 就 是 对 这 一 事实 的 证 明 。 

如 果 WITNESS 从 第 了 行 返回 TRUE， 则 它 已 发 现 对 模 来 说 ，x 是 1 的 一 个 非 平 凡 
平方 根 ， 这 荐 因为 我 们 有 x 关 +1l(modn)， 但 六 =10modnm。 推 论 33.35 说 明 仅 当 了 是 合 
数 时 才 可 能 对 nm 来 说 存在 1 的 非 平凡 平方 根 ， 因 此 ， 证 明了 xx 对 模 来 说 是 1 的 非 平凡 平 
方 根 , 也 就 证 明了 nm 是 合 数 。 

这 样 我 们 就 完成 了 有 关 WITNESS 正确 性 的 和 证明 。 如 果 调 用 WiTNESSta，n) 得 到 输 
吴 为 TRUE， 则 bn 必 为 合 数 ， 并 且 可 以 很 容易 地 从 a 和 nm 确定 ma 是 合 数 的 证 明 过 程 。 我 们 
现在 来 看 看 利用 了 WITNESS 的 Miller 一 Rabin 素数 测试 过 程 。 


MILLER--RABINOn， 3S) 
1 fper j<sl to s$ 
2 dn aa<-RANDOMLCI，n 一 1 


3 广 WTITNESSIA，D) 
引 then Tetmarn 合 数 肯定 地 
$ return 素数 几乎 肯定 地 


过 程 MILLER--RABIN 是 为 了 证 明 n 是 台数 所 进行 的 概率 性 搜索 过 程 。 主 循环 〔 从 第 
1 行 开 始 ) 从 Z， 中 随 挑选 s 个 a 值 (第 2 行 )。 如 果 所 挑选 的 一 个 a 值 是 na 为 合 数 的 “目击 
者 "、 则 过 程 MILLER-RABIN 在 第 4 行 输出 na 为 合 数 。 这 样 的 输出 总 是 正确 的 ， 这 一 点 
由 WITNESS 的 正确 性 证 明 可 以 看 出 。 如 果 在 s 次 试验 中 没有 发 现 目击 者 ， 则 
MILLER-RABIN 假定 这 是 因为 不 存在 目击 者 ， 因 此 n 为 素数 。 我们 将 看 到 如 果 s 足够 


加 
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大 ， 则 这 个 输出 结果 很 可 能 正 确 的 ， 人 得 也 存在 这 样 一 种 很 小 的 可 能 性 ， 即 过 程 在 选择 a 时 
运气 不 佳 ， 因 为 过 程 虽然 设 有 发 现 目击 者 ， 但 目击 者 却 确实 存在 . 

为 了 说 明 MILLER-RABIN 的 操作 过 程 ， 设 n 为 Carmichael 数 561.。 假定 选择 a=? 
作为 基 ， 图 33.4 说 明 WITNESS 在 最 后 一 次 平方 时 发 现 了 !1 的 非 平 凡 根 ， 因 为 a 天 王 67( 
mod n) ，a5t0= (mod n)。 因 此 a=7 是 n 为 合 数 的 目击 者 ，WITNESS(7，nh 返回 
TRUE， 因 而 MILLER-RABIN 返回 mn 是 合 数 。 

如 果 nm 是 一 个 肠 位 数 ， 则 MILLER-RABIN 需要 执行 DGsp) 次 算术 运算 和 O(s8 ) 次 
位 操作 ， 这 是 因为 从 渐 近 意义 上 说 它 需 要 执行 的 工作 仅 是 s 次 模 取 篆 运算 。 

Miller 一 Rabin 素数 测试 过 程 的 出 错 率 


” 如果 MILLER-RABIN 输出 素数 ， 则 它 仍 有 一 种 很 小 的 可 能 性 会 产生 错误 。 但 是 与 
PSEUDOPRIME 不 同 的 是 出 错 的 可 能 性 并 不 依赖 于 n; 对 该 过 程 也 不 存在 坏 的 输 人 。 相 反 
地 、 它 到 总 于 s 的 大 小 和 在 选取 基 值 a 时 * 抽 于 的 运气 "”。 同 时 ， 由 于 每 次 测试 要 比 对 式 
(33.42) 作 简 单 的 检查 更 严格 ， 因 此 从 总 的 原则 上 ， 对 随机 选取 的 整数 n， 其 出 错 率 应 该 是 
很 小 的 。 下列 定理 前 述 了 一 个 更 精确 的 论点 。 
定理 33.38 ”如果 mn 是 一 个 奇 合 数 ， 则 am 为 合 数 的 目击 者 的 数目 硅 少 为 (n-1) 7 2。 
证 明 : 证 明 过 程 说 明了 非 目击 者 的 数目 不 多 于 (n-1) 2， 草 含 着 定理 成 立 。 


-我们 首先 注意 到 任何 非 目 击 者 都 必须 是 Z， 的 一 个 成 员 ， 因 为 每 个 非 目击 者 a 都 满足 an 
三 1 (mod nj)。 介 是 ， 如 果 gcd (a，nm)j =d>1， 根 据 推 论 33.21 可 扼 ， 方 程 ax=1 (mod 
n) 没有 解 (特别 地 ，x=an" “不 是 解 )。 困 此 ，Z , 一 Z， 的 每 个 成 员 都 是 n 为 合 数 的 目击 
者 . 

为 了 完成 证 明 ， 我 们 要 说 明 非 目击 者 都 被 包含 在 Z 的 一 个 真子 群 B 中 。 根 据 推论 
33.16， 有 1Bl<<IZ ， 17 2。 因 为 世 ，|<n-1， 可 得 加 | 拓 O-_D “2。 由 此 可 知 ， 非 目击 者 的 数 
目 至 多 为 (n-1) 72， 也 就 是 说 目击 者 的 数目 至 少 有 (n-1) 7 2. 

下 面 我 们 来 说 明 如 何 找 出 Z， 的 包含 所 有 非 目击 者 的 真子 群 B。 具 体 分 两 种 情况 来 讨 
论 。 第 一 种 情况 : 存在 一 个 xEZ ， 便 得 : 

x" 关 ] (mod nm) (33，43] 

={bvZ. : br 一 1 (modn) }。 因为 B 在 模 n 的 溢 法 下 是 封闭 的 ， 根 据 定理 33.14 可 
知 . B 是 Z， 的 一 个 子 群 。 注 意 每 个 非 和 目击 者 都 属于 B， 因 为 一 个 非 目 击 者 a 满足 ar 1 
(moedtn)。 由 天 xv 己 ，-B， 所 以 中 是 Z， 的 一 个 真子 群 。 

第 二 种 情况 : 对 所 有 的 xCZ， 

xn = (modn) ， [33.44， 
在 这 种 情况 上 ，n 不 可 能 是 一 个 素数 需 。 为 摘 清 楚 这 一 点 ， 设 a=F， 其 中 p 是 一 个 奇 素 
数 ，e>1。 定理 33.32 昔 含 了 Z 包含 一 个 元 素 g 满足 ord。(g) =|IZ71=% (nj) = 
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(p-1) Pp* 。 疝 时 ， 由 等 式 (33.34) 和 离 数 对 数 定 理 (定理 33.33， 权 y= 伸 可 得 nr 一 TO 
(medo (ny ， 上 或 
fp 一 pp 一 1 
硅 于 e >1， 这 个 条 件 本 成立 ， 因 为 上 式 左边 可 被 p 除 ， 但 右 进 却 不 行 。 这 就 说 明了 nm 不 是 
一 个 素数 车。 
因为 不 是 一 个 素数 蝴 ， 我 们 把 它 分 解 成 一 个 积 和 12， 其 中 也 1 和 而 2 都 大 于 1 并 有 具 互 
硕 。 
定 兴 + 和 审 u 使 过 满足 nr1=20， 其 中 t>1，Uu 为 育 烙 ， 对 于 任何 a CC 2 ， 考 噶 序 列 : 
二 一 一， 3 ， 1 a2 >> (33，45) 
其 中 所 有 元 素 都 是 根据 和 模 n 计算 的 。 因 为 2|n-1， 故 n-! 的 二 进 制 表示 以 七 个 0 结尾 。 同 
时 ， 在 计算 @ modn 过 程 中 ， 有 的 元 素 正 是 由 WITNESS 计算 的 由 的 最 后 t1 个 值 ; 最 后 
七 个 操作 都 是 瞩 平 方 操作 。 
现在 ， 我 们 来 找 -个 到 40、1，…， 羡 ， 使 得 存在 一 个 vCZ 满足 v” "一 -1 (mod 
nj: 了 应 该 尽 可 能 地 大 。 等 人 台 这 种 条 件 的 j 是 肯定 存在 的 ， 因 为 为 奇数 : 我 们 可 以 选择 v 
= 一 !、j=0。 调整 v 使 之 满足 给 定 的 条 件 。 设 : 
B=ixZ : xs = 十 (modn) } 
因为 B 在 异 nm 的 乘法 上 下 二 封 闭 的 ， 夏 它 是 Z 的 一 个 子 群 。 于 是 Z， 1 可 钙 避 | 踪 尽 。 等 一 个 非 
日 击 者 都 必定 是 悍 的 成 员 ， 因 为 由 一 个 非 目 机 者 产后 的 序列 〈33.45) , 必须 或 者 为 全 1， 或 
者 在 第 j 个 亿 侠 之 前 包含 a 个 -1 (根据 j 的 最 大 性 )。 
现在 ， 我 们 利用 v 的 存在 性 来 说 明 存 在 一 个 wCZ， 一 B。 因为 v "=-1 (mod np) ,根据 
推论 33.29 有 v =-1 (mod mn )。 根 据 推论 33.28， 同 时 存在 一 个 W 满足 ， 
wsv (modni) 
ws (mod n2) 
王 是 
Wan 三 一 1| (modn , ) 
Wi =1 (modn.) 
这 些 等 式 和 推论 33.29 -- 起 理 售 了 
WE=1 (modn) 四 (33.46) 
因而 WNB、 因 为 vv Z，， 我 们 有 YCZ。。 于 是 ，wEZ。， 进 而 有 w 和民。-B。 根 据 -上 面 
的 说 明 可 知 B 是 Z* 的 一 个 真子 群 。 
在 棒 种 情况 中 ， 可 以 看 出 n 为 合 数 的 目击 者 的 数 旨 都 至 少 为 (n-1) 2。 
定理 33.39 ”对 什 意 奇数 n>2 和 正 整 数 s。，MILLER-RABINCn，s) 出 错 的 概率 至 多 
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为 2 *。 
证 明 : 利 肌 定理 33.38， 我 们 看 到 如 果 m 是 合 数 , 则 每 次 执行 第 1-4 行 的 循环 , 发 现 nm 为 
合 数 的 目击 者 x 的 概率 至 少 为 172。 只 有 当 MILLER--RABIN 运气 太 差 ， 在 主 循 环 总 共 S 
次 选 代 中 每 一 次 都 没 能 发 现 n 为 合 数 的 目击 者 时 ， 过 程 才 会 出 错 。 而 这 种 每 次 都 错过 发 现 
目击 者 的 概率 至 多 为 2 “。 

轴 此 ， 对 可 以 想像 得 到 药 几 乎 所 有 的 应 用 ， 选 取 s= 50 应 该 是 足 铝 的 。 如 果 我 们 试图 对 
晴 机 选取 的 大 整数 应 用 MILLER-RARBIN 来 找 出 大 素数 ， 则 可 以 论证 〈 尽 管 我 们 不 打算 在 
烤 证 明 ) 选取 较 小 的 s 值 (如 s=3) 也 未 必 导 致 错误 的 结论 。 即 对 一 个 随机 选取 的 奇 合 数 
nr、n 为 合 数 的 非 目击 者 的 预计 数 御 可 能 要 比 (n 一 1. 72 少 得 多 。 

但 是 ， 如 果 是 随机 选取 的 ， 则 我 们 运用 经 过 改进 的 定理 33.39 所 能 证 明 的 最 佳 结论 是 
非 目击 者 数量 至 多 为 《n-I) 4。 布 且 确实 存在 整数 n， 使 得 非 吓 击 者 的 数目 就 是 (na-1) 
/4。 


k 33.9 ”整数 的 因子 分 解 


假设 我 们 希望 将 一 个 整数 n 分解 为 汞 数 的 积 。 上 面 一 节 所 讨论 的 素数 测试 过 程 可 以 告 
诉 我 们 nm 是 否 是 合 数 ， 得 它 并 不 能 告诉 我 们 nm 的 素数 因子 (如 果 am 是 合 数 )]。 对 一 个 大 整数 mn 
进行 因子 分 解 似 乎 要 比 仅 确定 nm 是 素数 还 是 合 数 困难 得 多 。 即 使 用 当今 的 超级 计算 机 和 更 
行 的 最 佳 算法 ， 要 对 任意 一 个 200 位 的 十 进 制 整数 进行 因子 分 解 也 还 是 不 可 行 的 。 


POLLAR 了 D 的 rho 启发 性 方法 


对 到 B 的 所 有 整数 进行 试 除法 可 以 保证 完全 获得 到 B 的 性 意 数 的 因子 分 解 。 下 列 过 程 
做 相同 的 工作 量 就 能 对 到 B* 的 任意 数 进行 国 子 分 解 。 由 于 该 过 程 仅 仅 是 一 种 启发 性 方法 ， 
因此 聊 丰 能 保证 其 这 行 时 间 也 不 能 保证 其 运行 成 功 ， 不 过 在 实际 庶 用 中 该 过 程 还 是 非常 有 效 
的 。 
POLLARD-RHOn) 

1 im:1 

2 xia RANDOMIO，n 一 1) 

3 yn XI 

二 < 了 

5 whie TRUE 

白 do ti 

了 xieCx | 一 1 Imaodnm 
8 


过 < cd 一 Ki。 间 ) 


中 这 d 关 1 and den 
10 then Print 二 

1t 这 一 长 

12 then 。 Y< 一 Xi 

13 K<--2K 


该 过 程 的 执行 流程 如 下 。 第 1-2 行 把 让 初始 化 为 1， 把 x 初始 化 为 Z. 中 随机 选取 的 一 
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个 值 。 第 5 行 开 始 的 while 将 一 直 进 行 选 代 ， 并 搜索 nm 的 因子 。 在 wnile 循环 的 每 一 砍 和 迭代 


中 ,递归 起 
xi 人 一 1 modn (33.48) 
在 第 7? 行 中 用 二 计算 下 列 无 限 序列 
基 天 ， 其 其 ， 3 《33.49) 


中 xi 的 下 一 个 值 ，i 的 值 在 第 6 行 中 也 进行 了 相应 的 时 加 。 为 清楚 起 见 ， 代 码 中 使 用 了 下 标 
索 量 x， 低 即使 去 掉 所 有 的 下 标 ， 程 序 也 以 同样 方式 执行 ， 因 为 仅 需要 保留 最 近 计 算出 的 关 
的 值 。 
程序 不 时 地 把 最 近 计 算出 的 古 值 存 人 变量 y 中 。 上 具体 来 说 ， 存储 的 值 是 那些 下 标 为 2 
的 攻 的 变量 xi 
%1， Xo，， 和 4 X8 和 16r 
3 行 中 存储 值 xX,， 每 当 i=k 时 ， 第 12 行 就 存储 值 到 。 在 第 4 行 中 变量 k 该 科 戎 作 
， 并 且 每 当 和 更 新 y 司 ， 第 13 行 中 就 把 的 值 增加 一 倍 。 因 此 ，K 值 的 序列 为 1， 
， 并 甩 总 是 给 出 机 存 人 中 的 下 一 个 扩 慎 的 下 标 卡 。 
第 8--10 行 试图 用 存 人 y 的 值 和 和 的 当前 值 找 出 bn 的 一 个 因子 。 特定 地 ， 第 8 行 计算 出 
最 大 公约 数 d=8gcedty 一 xi，Dml， 如 果 由 是 na 的 非 平凡 约 数 (在 第 9 行 中 进行 检查 )， 则 第 1 
行 打 印 出 @ 的 值 。 


996 一 = 310 
中 4 396 
7 SS 本 
xz 177 84 四 
| | 人 从 
代 户 ie 局 | 
xz 1194 339 524 如 26 47 
595 .1033 1 
r， 63 人 上 63 
6 
2 
4 共 4 届 反 二 拒 
/ ， 【18 阳 / 
< 3 2 3 天 42 3 
1 / 1 
才 2 和 了 时 人 
mod 1387 mod 1 1 mod ?3 


fa) tb) 如 ) 


图 33.7 Pollard rho 启发 性 广东 
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起 官 这 一 寻找 因子 分 解 的 过 程 似 乎 有 点 神秘 。 但 是 注意 ，、POLLARD-RHO 诀 不 会 打 
印 出 错误 的 管 案 , 它 打 印 出 的 任何 数 都 是 n 的 非 平凡 约 数 。 当 然 ，POLLARD-AHO 也 可 能 
不 会 打印 出 任何 信息 , 并 没有 保证 它 能 产生 任何 结果 。 不 过 ， 我 们 将 看 到 ， 我 们 有 充分 的 理 
由 包 计 . POLLARD-RHO 在 while 循环 执行 大 约 Vp 次 达 代 后 会 打印 出 hn 的 一 个 因子 tp 
因此 ， 如 果 是 合 数 ， 在 大 约 经 nl 次 的 更 新 操作 后 ， 我 们 可 以 预计 该 过 程 已 经 找 出 了 要 
把 a 完全 分 解 因子 所 希 要 的 足够 的 约 数 ， 这 是 由 于 除了 可 能 有 的 最 大 的 -一 个 素 因 子 外，n 的 
每 一 个 素 因 子 p 均 小 于 Vn . 

分 析 一 下 要 经 过 多 入 模 m 的 随机 序列 中 才 会 重复 出 现 一 个 值 就 可 以 了 解 这 个 过 程 的 性 
能 。 由 于 Z, 是 有 限 的 、 并 且 序 列 (33,.49) 中 的 每 一 个 值 仅仅 取决 于 前 一 个 值 ， 所 以 序列 
(33.49) 最 终 将 产生 重复 。 一 旦 我 们 到 达 一 个 克 满足 对 某 个 j<i 有 天 =， 则 已 处 在 一 个 循 
环 中 ， 这 是 因为 x+ =xt，xhaz= xla， 等 等 。 该 过 程 取 和 名 为 “rho 启发 性 方法 "的 原因 就 在 于 
(如 图 33.7 所 示 ) 序列 xj，xz，…，x-1 可 以 画 成 mho 的 “ 尾 "， 而 循环 切 ，xri，…， 厂 可 以 
画 成 rho 的 * 体 "。 

让 我 们 考虑 这 祥 一 个 问题 : x 的 序列 发 生 重 复 需要 多 久 ? 实际 上 这 个 问题 的 答案 不 是 我 
们 所 需要 的 ， 但 我 们 将 会 看 到 如 何 修 改 这 个 论题 . 

为 了 进行 估算 ， 我 们 很 定 函 数 (xD modn 像 一 个 “随机 "函数 那样 进行 计算 、 当 
然 ， 它 并 不 是 一 个 走 正 的 随机 函 数 ， 但 根据 这 个 假设 所 获得 的 结论 与 我 们 对 
POLLARD 一 RHO 的 执行 情况 进行 的 观 赛 是 一 臻 的， 因而 , 我们 可 以 把 每 个 鳌 看 作 按 在 Z。 
上 均匀 分 布 的 方式 从 Zu。 中 独立 选取 的 。 根 据 第 6.6.1 节 中 对 生日 判定 的 分 析 ， 在 序列 出 现 
循环 以 前 预计 要 执行 的 步 数 为 @(Vn )。 

现在 我 们 根据 要 求 作 适 当 修改 。 设 p 是 满足 gcd(p，n/y p) =: 的 mn 的 一 个 非 平 凡 因 
子 。 例如， 如 果实 的 因子 分 解 为 na=pi p2”…p… ， 则 我 们 可 以 取 p 的 值 为 p: 〈 如 果 
el=1， 则 p 就 是 n 的 最 小 素数 因子 )。 序 列 《xi》 包含 一 个 相应 的 对 模 p 的 序列 “ 王 ′ 2， 其 
中 对 所 有 ii 

Xi=X” imod 
此 外 , 根据 中 国 余数 定理 有 下 式 成 立 : 
xi 一 人 一 D modP (33.50) 
这 是 因为 由 练习 33.1_ 6， 得 
(xzmod mn) mod =Xxmod P 

根据 前 面 的 推理 ， 我 们 发 现在 序列 (x") 重复 出 现 以 前 预计 执行 的 步 数 为 ev 了 ) 。 
果 与 na 相 比 ，p 是 一 个 很 小 的 数 ， 则 序列 《x) 可 能 比 序列 (%) 重复 的 频率 要 快 得 多 ， 多 
确 、 一 且 序 列 (xi) 中 的 两 个 元 素 仅 需 对 模 p 等 价 〈 无 需 对 模 n 等 价 ) 时 ， 序 列 (x' ) 就 
发 生 重复 。 图 33.7 中 的 (b) 和 (cj 说 明了 这 一 点 。 

设 + 表 示 <x 7“ ,> 序列 中 第 一 个 重复 出 现 的 值 的 下 标 ， 并 且 u>0 表示 所 产生 的 循环 疾 
路 的 长 度 ， 即 + 和 u>0 表示 所 产生 的 循环 回路 的 长 度 ， 即 1 和 u>0 是 对 所 有 iz0， 油 足 条 
件 x ,=x yi 的 最 小 值 。 根 据 上 面 的 论证 ，t 和 nu 的 预计 值 都 是 @(yp )。 注 意 ， 如 果 x1/ 
HH 一 X ti 则 到 (xuuirxai)。 因 此 ，gcdCcui 一 xni，n) 1 

所 以 ， 一 旦 POLLARD-RHO 把 满足 k>t 的 任何 值 zx 存 人 变量 y， 则 y modp 总 在 
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泪 p 和 届 回路 中 〈 如 果 把 一 个 新 值 存 人 y， 则 该 值 也 在 对 横 p 的 回路 中 ) 。 最 终 ， 赋 给 的 值 
将 大 年 u， 然 后 过 程 就 沿 着 模 为 p 的 回路 完成 整个 -次 循环 而 不 改变 y 的 值 。 当 x% * 遇 到 " 先 
前 站 学 储 的 对 模 p 的 y 值 时 ， 即 当 xy(mod p) 时 ， 我 们 就 找到 了 的 一 个 因子 。 
”发 现 的 因子 可 假定 是 因子 p， 但 偶尔 也 可 能 是 p 的 倍数 。 由 于 + 和 nu 的 预计 信 都 是 
eVp)， 所 以 产生 因子 p 所 要 求 的 预计 执行 步 数 为 @(VP )。 
攻 该 算法 不 会 如 预计 的 那样 执行 原因 有 两 条 。 第 一 ， 对 于 运用 时 间 的 启发 性 分 析 并 不 严 
烙 ， 有 可 能 对 模 p 的 值 的 回路 要 比 Vp 大 得 多 。 在 这 种 情况 下 ， 算 法 的 执行 虽然 仍然 正确 ， 
但 其 执行 速度 比 要 求 的 要 低 得 多 。 在 实际 应 用 中 ， 这 似乎 还 不 成 为 问题 。 第 一 ， 这 一 算法 得 
出 的 的 的 数 可 能 总 是 1 或 a 的 平凡 因子 。 例 如 ， 假 定 n= pa， 其 中 p 和 9 为 素数 。 可 能 
会 发 生 这 样 的 情况 : 关于 p 的 + 和 nu 的 值 与 关于 gg 的 + 和 的 值 相等 ， 因 此 因子 p 和 因子 q 
总 是 在 相同 的 gcd 运算 中 被 揭示 出 。 由 于 两 个 因子 同时 被 揭示 ， 所 以 也 就 揭示 出 无 用 的 平凡 . 
因子 pe=n。 在 实际 应 用 中 ， 这 似乎 也 不 是 一 个 真正 的 问题 。 如 果 需 要 ， 我 们 可 以 用 一 个 不 
同形 式 的 递归 式 tw- xi-e) modn 重新 开始 运行 该 启发 性 过 程 〈 值 = 0 和 c= 2 应 该 可 
以 避免 ， 其 原因 我 们 这 里 不 作 说 明 ， 但 对 其 他 值 都 没有 问题 ) 。 

当然 ， 上 述 分 析 过 程 是 启发 性 的 ， 不 是 严格 的 证 明 ， 因 为 递归 式 并 不 真正 是 * 随机 的 ，。 
然而 ， 在 实际 应 用 中 该 过 程 可 以 顺利 地 运行 ， 并 且 似 乎 和 我 们 在 上 面 的 启发 性 分 析 中 所 说明 
的 一 样 有 效 。 它 是 一 种 找 出 大 整数 的 小 素数 因子 时 可 供 选 择 的 方法 。 为 了 对 一 个 有 位 合 数 n 
完全 分 解 因子 ， 我 们 仅 需 找 出 所 有 小 于 [ alZ24 的 素数 因子 就 可 以 了 ， 因 此 我 们 可 预计 
POLLARD-RHO 需 执 行 的 算术 运算 至 多 为 ni/4= 28/4 次 ， 位 操作 至 多 为 nl7483 = 28748 
次 。POLLARD-RHO 最 具有 豚 引 力 的 特点 , 就 是 它 可 在 @(VP j 次 期 望 的 算术 运算 内 找 出 
的 一 个 小 因子 p。 


思 考 题 


33-1L 二进制 的 gcd 博 法 


在 大 多 数 计算 机 上 ， 了 碱 法 运算 、 调 试 一 个 二 进 制 整数 的 硼 偶 性 运算 以 及 折 半 运算 的 执行 
速度 都 要 比 计算 余数 的 执行 速度 快 。 本 问题 所 讨论 的 二 进 制 gc 算法 中 吉 免 了 欧 几 里 德 算法 
中 对 余数 的 计算 过 程 . 

a. 证 肌 : 如 果 a 和 都 是 偶数 ， 则 gcd(a，b)j 一 2gcdkta/ 2，b72). 

bb 证 明 : 如 果 a 是 奇数 ，b 是 偶数 ， 则 ged(a，b)] =gcdta，by 2)。 

c. 证 明 , 如 果 a 和 Pb 都 是 奇 数 ， 则 ged(a，b) =gcd((a-b) /2， by)。 

4. 设 计 一 个 有 效 的 二 进 制 gcd 竺 法， 输入 为 整数 a 和 b(azb) 并 且 算 法 的 运行 时 间 为 
O(l (max(a，b])))。 假 定 每 个 减法 运算 、 测 试 奇偶 性 运算 以 及 折 半 运算 都 能 在 单位 时 间 内 
执行 。 

33-2 ”对 网 几 里 德 算法 中 位 操作 的 分 析 

a. 证 明 : 用 普通 的 “ 纸 和 笔 " 算 法 来 进行 长 除法 运算 一 一 用 a 除 以 b， 得 到 商 q 和 余数 z 


一 些 要 执行 O((I+Igq) itgb) 次 位 操作 . 
b. 定 义 ha，tb) =(li+lga)y (i+ 区 bb。 证 明 , 过 程 EUcrID 在 把 计算 gcda， b) 的 问 
题 转化 为 计算 gcd(b，amod bj 的 问题 时 所 执行 的 位 操作 次 数 至 狗 为 (cufa，b) 一 AMb，a 
mod b))， 其 中 c>0 为 某 一 个 足够 大 的 常数 。 
c. 证 明 , 在 一 般 情况 下 EUCLIP(a，tb) 需要 执行 的 位 操作 次 妆 为 Outa，b) ) 当 其 输 
人 两 个 用 位 数 时 需要 执行 的 位 操作 次 数 为 Op ) 


33-3 关于 Fibonacci 数 的 三 个 算法 


在 已 知 m 的 情况 下 ， 本 问题 对 计算 第 n 个 Fibonacci 数 F。 的 三 种 针 法 的 效率 进行 了 比 
较 。 假定 两 个 数 的 加 法 、 减 法 和 雪 法 的 代价 都 是 D(I) ， 与 数 的 大 小 无 关 。 

a. 证 明 : 用 递归 式 〈2.13) 来 计算 F, 的 直接 递归 方法 的 运行 时 间 为 的 震 。 

b. 试 说 明 如 和 何 运用 记忆 法 在 On) 的 时 间 内 计算 F。. 

“. 试 说 明 如 何 仅 用 整数 加 法 和 恨 法 运算 就 可 以 在 Oflgn) 的 时 间 内 计算 ,。 (提示 : 考 


ss 了 。 本 它 的 短 ) 


d. 现 在 假设 对 两 个 有 位 数 相 加 需要 @(8) 的 时 间 ， 对 两 个 位 数 相 乘 需 要 @(8) 的 时 
间 。 如 果 这 样 来 更 合理 地 估计 基本 算术 运算 的 代价 ， 则 这 三 种 方法 的 运行 时 间 又 是 多 少 ? 


33-4 二 次 余数 


设 p 是 一 个 奇 素数 ， 如 果 关于 未 知 量 x 的 方程 双 =a( mod p) 有 解 ， 则 数 aE Z ， 就 是 
一 个 二 次 余数 ， 
a. 证明; 对 模 p， 恰 有 (p-1D) /2 个 二 次 余 吉 。 
b 如 果 了 是 素数 ， 对 aEZ; ， 我 们 定义 Legendre 符号 ( 一 ) 为 
】 四 和 如 果 a 是 对 模 p 的 二 次 余数 
e 一 1 和 理 则 
证 明 , 如 果 asZ,，， 则 


( 一 】 = ae “moed D) 
试 写 出 一 有 效 算法 使 其 能 确定 一 个 给 定 的 数 a 是 否 是 对 模 p 的 二 次 余数 , 并 分 析 算法 的 
效率 - 
c. 证 明 , 如 果 p 是 形 如 4k+3 的 素数 , 且 a 是 Z， 中 一 个 二 次 余数 ， 则 amod p 是 对 模 


p 的 a 的 平方 根 。 找 出 一 个 对 模 Pp 的 二 次 余数 a 的 平方 根 需要 多 长 时 间 ? 
d. 试 描述 一 个 有 效 的 随机 性 算法 以 找 出 一 个 以 任意 素数 p 为 模 的 非 二 次 余数 ， 所 给 出 
的 算法 平均 需要 执行 多 少 次 算术 运算 ? 
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练习 二 十 三 


33.1--1 证 明 有 无 穷 多 个 素数 ，{ 提 示 : 证 明 素数 pl，Pz，…，x 都 不 能 被 (pp…pr) +1 整 陈 ) 
33.1-2 证 明 : 如 果 alb 县 ble， 风 alc。 

33.1--3 证 明 : 如 果 p 是 质数 并 且 0<K<p， 则 gcd(k，p) = 1 

33.1-4 证 明 推 论 33.5、 


33.1-5 证 明 : 如 果 p 是 质数 并 且 0<<p， 则 pl( ). 证 明 对 所 有 束 数 a，b 和 质数 p， 


(ar+b) "=ar+bP Imod p)。 
33.1-6 证 明 : 如 果 a 和 日 是 任意 整数 ， 且 清 足 ab 和 日 > 心 则 对 任意 x， 有 
(xmaod by moda 一 Ximoda 罗 
在 相 园 的 报 设 下 证 明 对 任意 整数 x 和 7y， 如 时 x=Wmodb， 出 x==ymod a)， 

33,1-7 对 任意 整数 >0， 如 果 存 在 一 个 整数 a 满足 旺 =n， 则 我 们 说 整数 n 为 上 次 短 。 如 果 对 于 基 
个 整数 > 1，n> 1 是 一 个 次 震 ， 则 我 们 说 口 是 非 平凡 等 ,说 明 如 何在 关于 肥 的 多 项 式 时 间 内 确定 出 ~- 
个 月 位 整数 mn 中 非 平凡 震 ， 

33.1-8 证 明 式 (33.8] 一 33,12)。 

33.1-9 证 明 ged 运算 满足 结合 律 。 亦 即 , 证 明 对 所 有 整数 ab 和 上 

gcdta，Sscdfb，c)) =Scalgcdta， bj)，c) 

33.1-10* 证 明定 理 33.8。 

33.1-11 试 写 出 一 个 位 整数 除 以 -一 个 短 整数 的 有 效 算法 和 求 一 个 8 位 整数 除 以 一 个 短 整数 的 余数 的 
有 效 算法 。 所 给 出 的 算法 的 运行 时 间 应 为 O(8)。 ” 

33.1-12 ” 写 出 一 个 能 把 一 个 月 位 二 进 制 整数 转化 为 相应 的 十 进 制 表示 的 有 效 算 法 。 论 证 , 如 果 长 度 至 
多 为 有 的 整数 的 匀 法 与 除法 运算 所 需 时 间 为 M(8)， 则 执行 二 进 制 到 十 进 制 转换 所 需 的 时 间 为 @(M(B) jg 
入。( 提 示 : 运用 分 治 法 ， 把 数 分 为 隔 个 部 分 ， 分 别 进行 递归 操作 而 获得 所 需 结果 ) 


33,3-1 证 明和 由 等 式 (33.13) 一 (33.14)】 可 推 得 等 式 〈33.15) 。 

33.2-2 计算 过 程 EXTENDED~EUCLID(899，943) 的 输出 值 人 td。、x， 妇 。 

33.2-3 证 明 对 所 有 整数 ak 和 上 

Becdta，m =Bcdla+kn，n) 

33.2-4 公用 固定 量 的 存储 空间 〈 即 仅 存 储 常 数 个 整 束 值 ) 把 过 程 EUCLID 改写 为 选 代 形 式 ， 

33.2-5 如 果 a>bzn， 证 明 EUCLID 至 多 执行 了 1+ log ob 次 递归 调用 。 嚼 把 这 一 限制 改进 为 1+ 
iog wktb / gcd(ta，b))。 

33.2-6 过 竹 EXTENDED-EUCLID(F,，F,) 返回 秆 么 值 ? 证 明 所 给 出 的 答案 是 正太 的 。 

33.2-7 了 证 明 : 如 果 dla，dlb 并 且 d= ax+by， 则 d= PEcdta，hb) 来 验证 EXTENDED-EUCLID(a， 
b] 的 输出 《G，x，y)。 

33.2-8 用 递归 等 式 Bedlao，ai，…，a) 一 Ecd(al，scd(ai，…，B))》 来 定义 多 于 两 个 变量 的 ged 郴 
数 ， 让 明 ged 弓 数 的 返回 值 与 其 自 变量 的 次 序 无 关 。 说 明 如 何 找 出 满足 gcdfas，ai，…，a) 一 aoxoTaiXi 十 
Ta 的 0， 证明 所 给 出 的 算法 执行 的 除法 运算 诬 数 为 On+rieg (maxiai)。 

33.2-9 我 们 定 并 iemlal，a，…，a) 是 整数 损 ，2…，a 的 最 小 公信 数 ， 苑 每 个 aa 的 悦 数 中 的 最 
小 非 负 整 数 ， 说 最 如 和 何 镍 (两 个 外 变量 ) 的 Bed 函数 作为 子 程序 以 有 效 地 计算 山 emnfai，8o，…，au)。 

33.2-10 证 明 mn，nz，ni 和 nd 是 两 两 互 质 的 当 且 仅 当 gcd(n na ms ma 一 gcdtn na nx na) 一 1。 更 
一 般 了 地， 证 明 nm，n2，…，nDk 是 两 曙 互 质 揭 当 且 仅 当 从 m 中 导出 的 lgKk 对 数 互 为 质数 。 


33.3-! 曾 出 群 (Z.。+) 和 群 (Z; ,， ,) 的 运算 表 。 通 过 找 这 两 个 群 的 元 索 间 的 、 清 足 afbsse( mod 
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和 当 上 且 仅 当 xfa) ，x(b) =atc) (mod 5) 的 一 一 对 应 关系 来 证 明 这 两 个 群 局 构 ， 
33.3-~2 证 明定 理 33.14。 
33.3-3 ”证明 , 如 果 p 是 罕 数 日 e 是 正 整 数 ， 则 tp") =Pp 人 p-D . 
33.3 一 4 证 明 : 对 任意 a> 1 和 任意 aesZ。， 由 式 丰 (4xo) = ax mod 所 定义 的 函数 了 : Z， 一 民 
是 Z， 的 一 个 捧 列 。 


33.3 一 5 列举 出 Z ,和 Z 的 所 有 子 群 。 


33.4-1 求 出 方程 35x=1OUtmod 50) 的 所 有 解 . 。 

33.4~-2 证 明 : 当 gcdla，n) =1 时， 由 方程 ax==ay( modn) 可 得 xy modnl。 通 过 一 个 反例 
Beqata，njy > 1 的 情况 来 证 明 条 件 gcd(ta，D) = 上 是 必要 的 . 

33.4-3 考察 下 列 对 过 程 MODOLAR-LINEAR-EQOUATION-SDLVER 的 第 3 行 的 修改 : 

3 then xosx ”fbzd imodtnrd] 

修改 后 算法 是 否 能 正确 运行 ? 试 说 明 原 因 . 

33.4-4* 设 8 和 关 人 有 +-HTT(modPp) 是 一 个 上 次 多项式 ， 其 系数 于 均 属 于 并，p 为 素数 。 如 果 
fa) 天光 modap)， 则 说 明 af 之 ,为 了 的 零 位 。 证明 : 如 果 a 是 了 的 替 位 ， 册 对 某 个 二] 玫 的 多 项 起 如 xz)， 
有 fx =(x-a) gx) (mod pb)。 通 过 对 + 进行 归纳 ,来 证 明 t 次 多 项 式 flt) 对 模 ptp 为 素数 ) 至 多 有 上 个 不 
网 的 等 位 。 


33.5S-1 计算 出 司 下 列 两 个 方程 
xs 有 mod 5 
xsSmodTll 人 问 时 成 让 的 所 有 解 。 
33.5-2 试 找 出 被 2，3，4，5，、6 除 时 余 玫 分 别 为 1]，2，3，4，5 的 所 有 整数 x. 
33.5-3 论证 : 在 定理 33.27 的 定义 下 ， 如 果 gedla，nj =1， 风 人 fimod mm -ta modn)，(a 
mod n:)，-…， 量 


33.5~4 在 定理 33.27 的 定 光 下 ， 证 明 方 程 fxz) < 关 0fmod mm 的 根 的 数 月 等 十 每 个 方程 Wo 三 以 
mod ni)，fx) =0t mod n)，…，fx) ==0(rmod ni) 的 根 的 数 上 月 的 积 。 


moedn ))。 


33.6-1 ” 试 夯 出 一 张 表 以 说 明 Z， 中 每 个 元 素 的 人 葡 序 。 找 出 最 小 的 原始 根 闻 并 计算 出 一 张 表 ， 要 求 写 出 
对 所 有 xf Z，、 相 应 的 ind oo 的 值 。 


33.6-2 写 出 一 个 模 取 敌 竺 法， 要求 该 算法 检查 b 的 各 位 的 顺序 为 从 右 向 左 ， 而 不 是 从 左 向 右 ， 
- 33.6-3 根 设 已 知 wm， 远 说 明 如 何 运 用 过 程 MODULAR - EXPONEN-TIATION 计算 出 对 任意 a 
-<Z .atimodn 的 值 . 


33.7-1 考察 一 个 RSA 密 钥 集 台 ， 其 中 p=11，q=29，n=319，e= 一 3。 在 机 密 密 钥 中 用 到 的 D 人 是 
用 少 ?” 对 信息 M = 100 加 密 后 得 到 什么 信息 ? 

33.7-2 ， 证明; 如果 Alice 的 会 开 指数 已 等 于 3， 并 且 对 方 获 得 了 Alice 的 机 蜜 指数 d，。 财 对 方 能 和 够 在 关 
于 的 位 数 的 多 项 式 时 间 内 对 Alice 的 模 m 进行 分 解 〈 尽 管 我 们 不 要 求证 明 下 列 迪 论 ， 伍 读者 也 许 会 对 下 
列 事实 感 兴趣 : 即使 不 知道 条 件 e= 3， 上 述 结论 依 然 成 立 ) 。 

33.7-3* 征明, 在 如 于 意 交 上 说 RSA 是 倍增 的 : 

PAKCM )》 Pu(M) 一 PufMIM) (mod m) 

运用 这 个 事实 证 明 : 如 果 对 方 有 一 个 过 程 能 盘 有 效 地 对 从 之 , 中 随机 选取 的 并 用 P, 加 密 的 信息 解密 出 其 

中 的 百 分 之 一 ， 那 么 他 可 以 运用 一 种 概率 性 算法 以 一 个 较 大 的 概率 对 用 P, 加 密 的 任 一 条 信息 进行 解密 ， 
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33.8 一 1 证 明 : 如 果 一 个 整数 nn> 1 不 是 素数 或 素数 的 短 ， 风度 存 在 个 的 非 平方 要 | 
33.8-2* 可 以 稍稍 把 欧 拉 定理 加 强 为 以 下 形式 ， 对 所 有 


asZ， ， 
有 
= Imod ny ， 
其 中 Mn) 定义 为 
hn) =Icm(efp; ) ，… pp) ) (33.47) 


证 明 itn) lp(tn)、 如 果 Mn) In-1， 则 合 数 n 为 Carmichael 数 。 最 小 的 Canmichacl 数 为 551=3 .11 
17; 这 里 Mnj =1cmf2，10，16) =80， 它 可 被 560 整除 ， 证明 Catmichael 数 必 须 肛 是 “无 平方 数 " 《不 能 
被 任何 案 数 的 平方 所 束 除 )， 又 是 至 少 三 个 素数 的 积 。 因 为 这 不 原因 ， 所 以 Carmichael 数 不 是 很 普遍 的 . 

33.8-3 证 明 : 如 果 对 模 h，x 是 1 的 非 平凡 平方 根 ， 则 gcd(xz-1，m 和 ged(z+i，nm) 都 是 mn 的 非 平 
斤 约 数 。 


33.9 -1 在 图 33.7(aj 所 示 的 执行 过 程 ， 过 各 POLELARD-RHO 在 和 何 时 打印 出 1387 的 因子 73? 

33.9 -2 假设 我 们 已 知 函 数 下 世 一 并 和 一 个 初 值 xzE 工 。 定 闵 工 =Rx )，i=1，2，…。 设 1 和 
> 人 0 是 满足 xi=xhi i=0，1，… 的 最 小 值 、 在 Poliard 的 mho 算法 的 术语 中 .tt 为 zho 的 尾 的 长 谋 ，T 
是 rho 的 则 路 的 长 度 。 试 写 出 一 个 计算 +t 和 ua 的 值 的 有 效 算 法 , 并 分 析 其 运行 时 间 。 。 

33.9-3 要 发 现形 如 8 的 数 〈 其 中 p 是 素数 ,e> 1 的 一 个 因子 ，POLLARD-RHO 要 执行 和 多少 步 ? 

33.9 -4* PPOLLARD-RHO 的 一 个 缺 附 是 在 其 递归 过 程 的 每 一 步 都 机 计算 一 人 次 gcd。， 有 人 建议 对 
ged 的 计算 可 以 进行 批 处 理 : 黑 计 数 个 连续 的 5 的 积 ， 然 后 对 该 积 与 存储 的 y 值 求 出 ged 值 。 

请 说 明 如 何 实现 这 一 设计 思想 以 及 它 为 什么 是 正确 性 的 。 在 处 理 一 个 让 位 数 时 ， 所 选取 的 最 有 效 的 
批 处 理 规 模 是 密 大 ? 
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在 一 段 正 文中 找 出 某 个 模式 的 全 部 出 现 位 置 这 一 问题 在 文本 编辑 程序 中 经 常 出 更。 典型 
博 况 是 ， 正 在 被 编辑 的 文件 是 一 段 正文 ， 所 搜寻 的 模式 是 用 户 提出 的 一 个 特定 单词 。 解 决 这 
个 问题 的 有 效 算 法 能 极 大 地 提高 文本 编辑 程序 的 响应 性 能 。 匹 配 竺 法 也 常常 用 于 其 他 方 
面 ， 例 如 在 DNA 序列 中 搜寻 一 种 特定 模式 。 

串 匹 配 问题 的 形式 定义 是 这 样 的 ， 假 设 正文 是 一 个 长 度 为 的 数组 T[1..nj， 模 式 是 一 
个 长 度 为 和 的 数组 P[1.mj。 进 一 步 假设 P 和 了 的 元 素 都 是 属于 有 限 字 母 表 民 中 的 字符 ， 
例如 ， 我 们 可 以 有 y = {0，1} 吉 开 = {a，b，…， 格 ,字符 数组 P 和 T 常 称 为 字符 串 。 

如 果 0<&s<n-m， 并 且 Tfs+1..sHm=P[1.m] 〔 即 对 1 氢 j 和 吕 ， 有 Ts+Hj=b0D)， 册 我 们 
说 模式 P 在 正文 工 中 出 现 且 位 移 为 S&。({( 或 者 等 价 地 ， 模 式 忆 在 正文 垃 中 从 位 置 s+1 开始 出 
现 .) 如 果 P 在 工 中 出 现 且 位 移 为 s， 则 我 们 称 s 是 一 个 合法 人 位移， 否则 我 们 称 s 为 不 合法 
位 移 。 这 样 一 来 ， 捉 匹配 问题 就 变 成 一 个 找 出 某 指定 模式 P 在 一 指定 正文 工 中 出 现 的 所 有 
合法 位 移 的 问题 。 图 34.1 说 明了 这 个 定义 。 图 中 模式 为 P=abaa, 正文 为 
工 一 abcabaabcabac。 


text 下 





pattern 天 


图 341 曲 匹 配 问题 


本 章 的 安排 如 下 。 在 34.1 节 中 ， 我 们 回顾 了 关于 串 匹 配 问题 的 朴素 的 低 效 算法 ， 它 在 
最 坏 情况 下 的 运行 时 间 为 Dan-m+l)y im)。34.2 节 介 绍 了 电 Rabin 和 和 atp 发 现 的 一 种 有 
趣 的 串 匹 配 竺 法 。 该 算法 在 最 坏 情 况 下 的 运行 时 间 也 是 O(((n~m+1) 鼎 )， 但 在 实际 运用 
中 ， 平 均 说 来 该 算法 的 性 能 要 好 得 多 。 我 们 也 可 以 很 好 地 推广 这 种 算法 以 解决 其 他 的 串 匹 配 
问题 。34.3 节 中 描述 了 另 一 种 串 匹 配 算法 ， 该 算法 通过 构造 一 个 有 限 自 动机 来 搜寻 某 给 定 
模式 P 在 正文 中 的 出 现 位 置 。 它 的 运行 时 间 为 Otn+ml2)。34.4 节 中 介绍 了 与 其 类 似 但 更 
巧妙 的 nmth 一 Morris 一 Pratt( 或 人 MP) 算法 。 该 算法 的 运行 时 间 为 On+ml)j。 最 后 ，34.5 
节 中 描述 了 一 种 由 Boyer 和 Moore 发 现 的 算法 。 虽 然 该 算法 在 最 坏 情 况 下 的 运行 时 间 《 像 
Rabin~-Karp 算法 一 样 ) 并 不 优 于 朴素 的 串 匹配 算法 ， 但 在 实际 应 用 中 它 常 常 是 我 们 的 最 佳 
选择 。 

”记号 与 术语 
我 们 将 用 习 * 表示 用 字母 表 王 中 的 字符 形成 的 所 有 有 限 长 度 的 串 的 集合 。 在 本 章 中， 我 
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们 仅 考 虑 长 度 有 限 的 串 。 长 度 为 0 的 空间 用 e 表示 ， 它 也 属于 工 - 。 串 x 的 长 度 用 | 对 表示 。 
两 个 串 x 和 y 的 并 置 表示 为 xy， 其 长 度 为 区 + 人 Y。 

己 知 串 x 和 w， 如 果 对 于 某 个 串 yE 王 " ， 有 x=wy， 则 我 们 说 串 w 是 串 x 的 前 邹 ， 表 
示 为 wSx。 注 意 ， 如 果 wcx， 则 Iw| 科 | 允 。 类 伏地 ， 如 果 对 某 个 串 yYEy “"“， 有 X=yw， 则 
我 们 说 串 w 是 昌 x 的 后 缀 ， 表 示 为 wx。 如 果 有 wx， 则 | 加 | 所 | 为 。 空 串 = 既是 每 个 串 的 
前 绥 ， 也 是 每 个 捉 的 后 绥 。 例 如 ， 我 们 有 ab 一 abcca，cca 二 abcca。 

对 任意 串 x 和 yy 以 及 任意 字符 a，x=y 当 且 仅 当 xa>=>ya。 请 注意 ，< 和 一 都 是 传递 关 
系 。 我 们 以 后 会 用 到 下 列 引 理 : 四 

引 理 34.1 〈 重 登 后 组 引 理 ) ”假设 x，y 和 z 基 满足 xz 和 Yy=z 的 三 个 串 ， 如 果 ! 对 所 
加 ， 则 x 二 Yi 如 果 |xj 关 | 吕 ， 则 y=x 如果 由 = 人 ， 则 x=7。 

证 明 : 参见 图 34.2 的 图 形 证 明 过 程 。 (4aj 着 语系 |， 则 xy。 (bj 着 | 双关 人 |， 则 y 二 
x。({c) 车 必 王 | 由， 则 x 一 y。 

为 了 使 记号 简洁, 我 们 将 把 模式 P[1.. 中 的 由 kk 个 字符 组 成 的 前 疹 用 P 表示 。 因 此 ， 
Pu=8#，、Pu = 了 =P[1.m]。 类 似 地 ， 我 们 把 正文 工 的 由 k 个 字符 组 成 的 前 缘 表 示 为 卫 。 采 用 
这 种 记号 ， 我 们 就 可 以 把 串 匹 配 问 题 表 述 为 : 找 出 范围 为 4 么 s 么 nm 一 m 并 满足 P 二 Ts 的 所 
有 位 移 s， 在 我 位 的 伪 代 码 中 ， 人 允许 把 比较 两 个 等 长 的 串 是 否 相 等 的 操作 当 作 原 语 操作 。 如 
果 对 串 的 比较 是 从 左 往 右 进行 ， 并 且 发 现 一 个 不 号 配 字符 时 比较 就 伐 目 ， 风 我 们 假设 这 样 一 
个 测试 过 程 所 需 的 时 间 是 关于 所 发 现 的 匹配 字符 数目 的 线性 函数 。 更 精确 地 说 ， 我 们 假设 测 
试 <x= 罗 希 要 的 时 间 为 9@(t+1)， 其 中 t 是 满足 zcx 且 zcy 的 最 长 申 z 的 长 度 。 


而 - 者 
二 平 
7 》 
让 4 
可 ET 
? 和》 
9 ) 


图 34.2 引 理 34.1 的 证 , 涩 过 程 图 示 


34.1 ”朴素 的 串 匹 配 算法 


亚 





(人 b) 


下 面 我 们 要 介绍 一 个 朴素 算法 , 它 用 一 个 循环 来 找 出 所 有 合法 位 移 ， 该 循环 依次 对 
n 一 Im+l 个 可 能 的 s 值 检查 条 件 Pf1..m]=T[s+1..s+m]。 


NAIVE-STRINGMATCHERtT，P) 
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1 nlength[T] 

2 加 <-ienEth[P] 

3 toT 8 站 to 站 一 
才 do 这 P[i.m]=Tfs+t..s+Hm] 

5 then prnt" 模 式 出 现 旦 位移 为 "8 


这 种 朴素 的 串 匹 本 过程 可 以 形 像 地 看 成 用 一 个 包含 模式 的 “模板 * 沿 正文 滑动 ， 同 时 对 每 
个 位 移 注 意 模板 上 的 字符 是 否 与 正文 中 指 相 应 字符 相等 ， 如 图 34.3 所 示 , 模式 为 P=aab， 
正文 为 T=acaabc。 从 第 3 行 开 始 的 for 循环 显 式 地 考察 每 一 个 可 能 的 位 移 。 第 4 行 的 测试 
代码 确定 当前 位 移 是 否 合 法 , 该 测试 隐 含 着 一 个 循环 。 该 循环 逐个 对 相应 位 置 上 的 字符 进行 
检查 , 直至 所 有 位 置 都 能 成 功 地 进行 亚 配 或 者 发 现 一 个 不 王 配 的 位 置 。 第 $ 行 打印 每 个 人 台 法 
位 移 s。 


al|clalalblej| [alclalaible cl|alalbic| |alelalalb|o| 
《三 昌 到 上 二] 要 士 生 量 疼 上 二 3 琵 

晤 百 口 四 昕 马 [TaTz| [eaTb 

(a) tb) (可 


图 34.3 朴 罕 串 匹 配 竺 法 的 操作 过 程 


过 程 NAIVE-STRING-MATCHER 在 最 坏 情况 下 的 运行 时 间 为 吕 ((n-m+1l) 中)。 例 
奶 ， 考 察 正 文 蝇 am" tn 个 a 组 成 的 串 }》 和 模式 加 。 对 nm+l 个 可 能 的 位 移 值 s 的 每 一 个 
值 ， 第 4 行 中 比较 相 庶 字 符 的 隐 会 的 循环 要 证 明 位 移 的 合法 性 ， 必 须 执 行 惠 次。 因此 最 坏 
情况 下 的 运行 时 间 为 @(n-m+l m)， 如 果 mm= [ny72J， 则 为 @tn)。 

我 们 将 看 到 ，NAIVE-STRING-MATCHER 并 不 是 关于 这 个 问题 的 理想 过 程 。 在 本 
章 中 我 们 还 要 介绍 一 种 最 坏 情 况 下 的 运行 时 间 为 Onfm) 的 算法 。 这 种 朴素 的 串 号 配 算法 
的 效率 不 高, 其 原因 在 于 对 于 s 的 一 个 值 , 我 们 获得 的 关于 正文 的 信息 在 考虑 s 的 其 他 值 时 完 
全 被 乱 路 了。 这 样 的 信息 可 能 是 非常 有 用 的 。 例 如 ， 如 果 了 = aaab， 并 且 我 们 发 现 s=0 是 
台 靶 的 ， 则 位 移 1，2，3 都 不 可 能 是 合法 位 移 ， 因 为 TI[4]=b。 后 面 我 们 将 考察 能 够 有 效 地 
利用 这 部 分 信息 的 几 种 方法 。 


34.2 ”及 abin 一 Karp 算法 


Rabin 和 Karp 所 建议 的 串 匹 配 算法 在 实际 应 用 中 能 够 较 好 地 和 运行， 我们 还 可 以 从 中 归 
钠 册 有 关 问 题 的 其 他 算法 ， 如 二 维 模式 匹配 。 及 abin 一 儿 arp 算法 在 最 十 情 况 下 的 运行 时 间 为 
On-m+ti m)， 但 它 的 平均 情况 运行 时 间 还 是 比较 好 的 。 
该 算法 中 利用 了 一 些 初 等 数论 概念 ， 如 两 个 数 对 于 第 三 个 数 的 模 等 价 。 要 了 解 有 关 的 定 
义 请 参 昭 33.1 节 的 内 容 。 
为 了 便于 说 明 ， 我 们 假定 工 = {f0，1，2，…，9}j， 这 样 每 个 字符 都 是 一 个 十 进 制 数字 。 
(一 般 情 况 下 ， 我 们 可 能 假定 每 个 字符 都 是 基数 为 电 的 表示 法 中 的 一 个 数字 ，d = 人 2 .)》 我 们 
可 以 用 一 个 长 度 为 的 十 进 制 数 来 表示 由 站 个 连续 字符 组 成 的 串 。 因 此 , 字符 串 31415 就 对 
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应 下 进 制 数 34 415， 如 果 输 人 字符 既 可 以 着 作 图 形 符 导 ， 也 可 以 看 作 数 字 ， 我 们 就 会 发 现 
在 本 和 节 中 的 标准 止 文字 体 中 运用 这 种 数字 表示 是 很 方便 的 。 

巴 基 一 个 模式 P=Timl， 设 P 污 示 其 相 评 的 十 进 制 数 的 值 。 类 亿 地 ， 如 果 已 知 正文 
ITL1..a， 我 们 就 用 所 米 表 从 其 民 庆 为 种 的 子 串 TIs+1.s+mjs=0，1，…，Dn-o) 相 应 的 十 进 
制 数 的 值 。 当 然 、 4=P 当 有 内 仅 当 TIs+1..s+m]=P[1..m], 因此 s 是 合法 位 移 当 有 内 仅 涩 =P. 
如 果 我 们 能 够 在 Otm) 的 计 阿 贞 计 算出 了 的 值 , 并 在 总 共 Dn) 的 时 间 内 计算 出 所 有 上 的 
值 .那么 通过 把 P 值 与 每 个 扫 值 进行 比较 ， 我 们 就 能 够 在 DOtn)j 的 时 间 内 求 出 所 有 合法 位 
移 s【〈 目 前 我 们 暂 不 考虑 P 和 所 可 能 是 很 大 的 数 的 情况 )。 

我 们 可 以 适用 呀 纳 法 则 (和 参 抑 32.1 节 ) 来 在 Ofttny 的 时 间 内 计算 P 的 值 ， 

P= PIm]+10(P[m 一 +H100P[m 一 2]+… 二 10(P[2]+10Pf1) …)) 
类 似 地 ， 我 们 岂可 以 根据 Til.m] 在 DOtm) 的 时 间 内 计算 出 to 的 值 。 

为 了 和 在 On 一 my 的 时 间 内 计算 出 剩余 的 值 古 ， 避 ，…， 全 -， ， 注 意 到 可 坟 在 常数 时 间 内 

根据 # 计算 出 攻 ,， 这 是 因为 : 

ti = 10(0L 一 10" T[s+H) 上 +T[Is+m+l] (34.1 

例如 ， 如 果 m=S，tU= 31415， 则 我 们 希望 去 掉 高 位 数字 T[s+1]=3， 再 各 人 一 个 低位 

数字 (假定 人 它 症 TIs+S+i= 2) 就 得 到 : 

(= 10(31415-10000. 3) +2 一 14152 
减 去 10” TIs+1 就 从 中 去 掉 了 商 位 数字 ， 再 把 结果 乘 以 10 就 使 数位 向 左 移 了 一 位 。 然 后 
“和 册 加 芋 开 ls+m+]j 加 可 以 如 人 一 个 适当 的 低位 数 。 如 果 能 够 预先 计算 出 常数 10m (用 我 们 
在 33.6 节 介 绍 的 技术 就 可 以 在 OUlg m) 的 时 间 内 完成 这 一 计算 过 程 ， 但 对 这 个 应 用 问题 ， 
我 们 用- -种 篇 熏 的 运行 时 间 为 Dm) 的 方法 就 可 以 进行 计算 )， 则 每 次 执行 式 〈34.1) 需要 
执行 的 算术 运算 次 数 为 常数 。 因 此 ，P 和 ff 本，…，ft -都 可 以 在 DCn+mh 的 时 间 内 计算 
出 来 ， 这 样 我 们 就 可 以 在 On+m) 的 运行 时 间 内 找 出 模式 P[1..m] 在 正文 TI1.o 中 的 所 有 出 
现 倍 距 。 

对 该 过 程 米 说 存在 的 唯 --- 岗 礁 就 是 各 f 的 值 可 能 太 大 ， 使 得 我 们 不 能 方便 地 对 其 进行 
处 旦 。 姬 果 了 包公 和 个 守 符 ， 球 么 关于 在 上 的 每 供 算术 运算 需要 的 时 间 为 "常数 "的 翁 设 
就 蚌 不 合理 的 。 李 运 的 、 对 这 一 问题 还 存在 一 种 简单 的 补救 方法 ， 如 图 34.4 所 示 : 对 一 个 
合适 的 模 9 来 计算 p 和 tt 的 值 。 得 个 字符 是 一 个 二 进 制 数 , 因 为 bp tb 以 及 递归 式 (34.10) 计 
算 过 程 都 可 以 对 绕 9 进行 ， 所 以 我 们 可 以 看 出 对 模 电 来 说 ，P 和 所 有 的 上 的 值 都 可 以 在 
Din+m) 的 时 间 内 针 算 出 来 。 我 们 通常 选 g 为 一 个 素数 ， 使 得 10q 正好 为 一 个 计算 机 字 
长 ， 用 单 精度 算 本 运算 就 可 以 执行 所 有 必要 的 运算 过 程 。 在 一 般 情 况 下 ， 采 用 d 进 制 的 字 
怀表 :0、1，…，d- 时 ， 我 们 选取 的 q 要 满足 使 dq 的 值 在 一 个 计算 机 字 长 内 ， 并 调整 式 
(34.1) 以 使 其 村 模 g 进 行 运 算 ， 使 其 成 为 : 

L = 一 (dtt, 一 TI[s+1]hy+Tls+mHy moddq (34.2) 
其 中 h=d" (mod q) 是 一 个 症 位 正文 窗口 中 高 位 数位 上 的 数字 “1 的 值 。 

但 是 ， 加 入 模 q 后 美 中 不 吓 的 是 由 hp(imod q) 并 不 能 说 明志 =P。 另 一 方面 ， 如 果 上 
BCmed q)， 则 可 以 肯定 kh 夭 p， 因 此 位 称 s 是 韭 法 的 。 央 此 , 我 们 可 以 把 测试 tp( ined 
中 作为 一 种 快速 的 岩 发 性 测试 方法 以 排除 非法 位 移 s。 对 任何 满足 tp( mod qj 的 位 移 
s$， 必 须 进 一 步 进行 测 试 以 决定 s 是 真正 的 合法 位 移 还 是 一 个 “ 伪 合 中 点 "”。 我 们 可 以 通过 显 
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式 地 检查 杀 件 PLL.ml= Ts+1.s+mj 来 完成 这 种 测试 。 如 果 q 足够 大 ， 那 么 我 们 可 以 期 望 * 伪 
命 市 点 "很 少 册 现 以 使 得 进行 额外 检查 的 代价 足 各 低 . 





w 抽 ji 8 让 Dus 
ratch jh 这 
tb) 


名 寺 TY 
high-ongcr low-order 
而 有 有 让 三 


14152 到 (31415 3.10000).10+2 《mod 13) 
着 (7 一 3.310+2 (mog 13) 
可 着 (mod 13) 





图 34.4 Rabin 一 及 arp 算法 


下 殉 过 程 是 对 上 述 设 计 轴 想 的 精 化 。 过 程 的 输入 为 正文 T， 模 式 P， 使 用 的 基数 'd《 它 
的 典型 的 值 为 开 ) 以 及 使 用 的 素数 q。 


RaABIN 一 天上 RPMATCHERIT，P、d，9) 

niIeneth[T] 

ni= length[] 

h< dm imeod 

咏 <- 必 

U 

ior ia 1 记过 

do pe-dpHPi) moda 
udto+TI) nodg 

for  s<-0 to nm- 中 


下 人 -全 一 


一 599 一 


10 do 并 5=t 
11 then 这 Pf.m]=Tis+1..s+m] 


12 then“ 模 式 出 现 且 位 移 沪 ”S 
13 让 3<<m 一 TI 
14 then ttdftT[sS+Hlh) +T[s+m+l) ) modaq 


过 程 RABIN- 攻 ARP-MATCHER 的 执行 过 程 如 下 。 所 有 的 字符 都 是 基数 为 d 的 数 
字 。 代 为 了 说 明 清 楚 ， 我 们 给 t+ 语 加 了 下 标 ; 去 掉 所 有 的 下 标 后 程序 照样 能 够 正确 运行 . 第 
3 行 把 h 初始 化 为 mm 位 窗口 中 高 位 数字 的 值 。 第 4-8 行 计算 出 p. 的 得 为 FL1..m] mod q， 
的 值 为 TLLm] modq。、 第 9 行 开 始 的 for 循环 对 所 有 可 能 的 位 移 s 进行 迭代 过 程 ， 该 循环 保 
持 下 列 条 件 不 变 : 每 当 第 10 行 被 执行 时 ，8= TIs+1..stHm] mod qg。 如 果 在 第 10 行 中 有 pP= tb 
(一 个 “命中 点 ")， 则 我 们 在 第 11 行 中 条 件 PIi..m]= T[s+1..s+mj 是 否 满足 以 排除 它 是 “ 伪 命 
中 点 "的 可 能 性 。 所 发 现 的 任何 合法 位 移 者 在 第 12 行 中 被 打印 出 来 。 如 果 s<n-m (第 13 
行 中 检查 该 条 件 )， 则 至 少 要 再 执行 一 次 for 循环 ， 因 此 这 对 首先 执行 第 14 行 以 保证 再 次 热 
行 到 第 10 行 时 循环 的 不 变 条 件 依 然 保 持 成 立 。 第 14 行 直接 利用 等 式 (34.2) 就 可 以 在 常数 
时 间 内 根据 ft modg 的 值 计 算出 tl modagq 的 值 。 . 

在 最 坏 情 况 下 ，RABIN-KARP-MATCHER 的 运行 时 间 为 @((na-m+ly m)， 因 为 
Rabin-Karp 算法 对 每 个 合法 位 移 均 进行 显 式 验证 。 如 果 了 =am 并 且 T=anr， 册 验证 所 需 的 
时 间 为 @(n~m+l) ml)， 因 为 n-m+l 个 可 能 的 位 移 中 等 一 个 都 是 人 台 法 位 移 。 (同时 请 注 
意 ， 第 3 行 的 计算 dm moedq 以 及 第 6--8 行 的 循环 所 需 的 时 间 为 Dtm)y =On-m+l) 
mm。)} 

在 许多 实际 庶 用 中 ， 我 们 预计 合法 位 移 数 很 少 〈 也 许 其 中 只 有 O(1) 个 )， 因 此 ， 算 法 
的 期 望 运行 时 间 为 DCn+m) 加 上 处 理 伪 命中 点 所 需 的 时 间 。 假 设 减少 模 q 的 值 就 像 是 从 了 开 " 
到 Z. 上 的 一 个 随机 映射 ， 基 于 这 种 假设 我 们 可 以 进行 启发 性 分 析 。 (参见 12.3.1 节 中 对 杂 
凑 除 法 的 讨论 ， 要 正式 定义 或 证 明 这 个 假设 是 比较 困难 的 ， 但 是 有 一 种 可 行 的 方法 , 就 是 假 
定 q 是 从 适当 大 的 整数 中 随机 得 出 的 。 我 们 在 此 将 不 进行 形式 化 定义 .) 于 是 我 们 就 可 以 预 
计 伪 命中 的 次 数 为 Da yq)， 因 为 可 以 估计 出 任意 的 t+ 对 模 g 等 价 于 p 的 概率 为 1 /q。 因 
此 , Rabin--Karp 算法 的 期 望 运 行 时 间 为 : 

On) +Omn(vtn yq)) 
去 中 v 是 合法 位 移 数 。 如 果 我 们 选取 g 补 ， 则 这 人 一 算法 的 送行 时 间 为 On)。 就 是 说 ， 如 
果 期 望 的 合法 位 移 数 很 少 (D(D ) ， 而 我 们 选取 的 素数 q 要 比 模式 的 长 度 大 得 多 ， 则 可 以 预 
计 Rabin 一 长 arp 算法 的 运行 时 间 为 DOnHmy)。 


34.3 ”利用 有 限 自 动机 进行 串 匹 配 


很 多 此 匹 配 算法 都 要 建立 一 个 有 限 自 动机 ， 它 通过 对 正文 串 工 进行 打 描 的 方法 找 出 模 
式 呈 的 所 有 出 现 位 置 。 本 节 将 介绍 一 种 建立 这 样 的 自动 机 的 方法 。 用 于 串 匹 配 的 自动 机 都 
是 非常 有 效 的 : 它们 只 对 每 个 正文 字符 检查 一 次 ， 并 且 检 查 每 个 正文 字符 的 时 间 为 常数 。 因 
此 ， 在 建立 好 目 动 机 后 所 需要 的 时 间 为 @@mnj) 。 但 是 ， 如 果 开 很 大 ， 建 立 自 动机 所 花 的 时 间 
也 可 能 是 很 多 的 。34.4 节 描 述 了 解决 这 个 问题 的 一 种 巧妙 方法 。 
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在 本 节 的 开头 ， 我 们 先 来 定义 有 限 昌 动机 概念 。 然 后 , 我 们 要 考察 一 种 特殊 的 串 瑟 配 量 
动机 , 并 说 明 旭 和 何 利用 它 找 出 一 个 模式 在 正文 中 的 出 现 位 置 。 对 这 个 问题 的 讨论 中 包括 对 一 
段 给 定 的 正文 如 何 模拟 出 串 亚 配 自动 机 的 执行 步 荫 的 一 些 细节 。 最 后 ， 我 们 将 痪 明 对 一 个 给 
定 的 输入 模式 如 何 构造 相 庶 的 串 匹 配 自动 机 。 


有 限 自动 机 


一 个 有 限 目 动机 M 是 一 个 5 元 组 (Q，qo，A， 荆 ，56)， 其 中 : 

. 中 是 状态 的 有 限 集 合 ， 

 Q 芋 初 态 

- 和 三 和 是 一 个 接收 状态 集合 

- 王 是 有 限 的 输入 宇 母 表 

6 是 一 个 从 Qx 工 到 总 的 图 数 ， 称 为 M 的 变迁 枫 数 . 

有 限 自 动机 开始 于 状态 du， 每 次 读 人 输入 串 的 的 一 个 字符 . 如 果 有 限 自动 机 在 状态 | 
时 读 人 了 输 人 字符 a， 则 它 从 状态 q 变 为 状态 5(q，a)] 《进行 了 一 次 变迁 )。 每 当 其 当 音 状态 
属于 A 了 时， 我 们 就 说 自动 机 M 接收 了 千 今 为 止 所 读 人 的 串 。 没 有 定 接 收 的 输 人 称 为 被 拒 序 
的 输 和 人。 图 345 用 一 个 简单 的 两 状态 月 到 各 放 因 了 这 。《【〈 状 态 集 中 = 10，]j， 季 姑 这 
态 qu=0， 输 入 字 苹 表 9 = 一 1a，bl 1 


| 此 
生生 ab 


(0 
图 34.5 一 个 简单 的 两 状态 有 限 自 动机 


有 限 自 动机 M 可 以 推导 出 一 个 函数 pg， 称 为 终 态 函数 ， 它 是 从 工 到 忠 的 攻 数 ， 并 满 
足 : pw) 是 M 在 扫描 串 w 后 终止 时 的 状态 。 因 此 ，M 接收 串 w 涯 且 仅 当 ofw) 近 A。 国 
数 虽 由 王 列 递归 关系 定义 : : 
pts) 一 qu， 
tfwal 一 5Up(w)，a)j， 玉 工 - ，a 人 人 工 


串 匹 配 自动 机 


对 每 个 模式 P 都 存在 一 个 串 匹配 自动 机 , 我 们 必须 在 预 处 理 阶段 根据 模式 构造 出 相应 的 
自动 机 后 , 才能 利用 它 来 搜寻 正文 晶 。 图 34.6 说 明了 关于 模式 P= ababaca 的 有 限 自动 机 的 
构造 过 程 。(a)j 能 接受 所 有 了 以 ababaca 结尾 的 中 的 串 匹 配 自动 机 的 状态 转换 图 ; (p) 相应 的 
转换 函数 5 和 模式 串 了 = ababaca。 从 现在 开始 ， 我 们 假定 酝 是 一 一 个 已 知 的 图 件 区 起 昌 。 为 
了 使 说 明 简 洁 ， 我 们 在 下 面 的 概念 中 将 不 特别 指出 对 P 的 依赖 关系 。 

为 了 详细 说 明 与 一 个 给 定 模式 P[1..m 相 应 的 串 匹配 自动 机 ， 音 先 定义 一 个 秧 助 函 数 
ec， 称 为 相应 P 的 后 缀 函数 。 函 数 e 是 一 个 从 工 * 到 {0，1，…， 旭 } 上 定义 的 映射 , c(x) 是 x 
的 后 刍 中 的 最 长 前 绿 的 长 度 : 


一 601 一 ，… 


Itx) 一 maxftk : 也 ,一 X} 
因为 空 串 训 =E 是 每 一 个 串 的 后 缀 ， 所 以 后 绷 函数 是 有 完备 定义 的 。 鲍 如 ， 对 模式 
P=ab， 我 们 有 ole) =0，afecaca) =1，efccab) 一 2。 对 一 个 长 度 为 巴 的 模式 来 说 ， 
oatx) 一 m 当 朋 和 反 当 PP>x。 根 据 后 绷 函 数 的 定义 有 : 如 果 X=y， 则 fx) 所 cfy)。 








严 
b 
生 
bb 
e 上 一 123456789101 
”最 好 中 -一 一 古人 
mewr 012345455 国 : : 
[h) 【ce 
图 34.6 串 匹 配 自 动机 的 一 个 例子 
对 相应 主 基 给 定 模 式 Pi.m] 的 串 丐 配 自 动机 定义 如 下 : 
- 状态 集中 为 W0，1，…，mh， 初 始 状态 为 qq， 状态 hn 是 唯一 的 接收 状态 。 
- 对 任意 状态 q 和 字符 a， 变 证 图 煞 “自如 下 等 下 定 文 : 
Stq，aj 三 术 Pual) (34.3) 
自动 机 在 操作 中 保持 如 下 条 件 不 变 : 
plT) =alTI) (34.4) 


下 的 定理 34.4 将 证 明 这 个 结论 。 这 意味 其 对 正文 哩 工 的 前 面 i 个 字符 进行 持 描 后 ， 
自动 机 的 状态 为 wo(TD =q， 其 中 q=elT) 是 最 长 后 缀 Ti 的 长 度 , Ti 是 模式 P 的 一 个 前 
缀 。 如 果 下 面 扫描 到 的 字符 为 THi+l=a, 则 自动 机 的 状态 应 转换 为 cf(Ti) = al(Tia)。 该 定 
理 的 证 明 过 程 说 明 ce(Tia) =e(Pua)。 就 是 说 ， 为 了 计算 P 的 前 全 Tia 的 最 长 后 月 的 长 度 ， 
我 们 可 以 先 计 算出 耻 的 前 缀 Pua 的 最 长 后 级。 在 每 一 种 状态 下 ， 自 动机 仅 需 知道 迄今 已 读 
和 的 中 的 后 缀 P 的 最 长 前 邹 的 长 度 。 因 此 ， 吐 5(q，aj =e(Poa) 可 以 保持 所 需 的 不 变 式 
(34.4) 成 立 ， 我 们 将 在 稍 后 使 这 一 非 形 式 证 明 过 程 严格 化 。 

例如 ， 在 图 34.6 所 示 的 串 匹 配 自动 机 中 ， 我 们 有 56(5，b) =4。 这 个 结论 是 从 以 下 事实 
推导 出 的 : 如 果 在 状态 q= 5 时 自动 机 读 人 一 个 b、 则 Pub 一 ababab， 于 是 同时 也 是 ababab 
的 后 绥 P 的 最 长 前 邹 为 P;,= abab。 
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为 了 清楚 地 说 明 串 匹配 自动 机 的 操作 过 程 ， 我 们 给 出 一 个 简单 而 有 效 的 程序 , 它 用 来 模 
拟 这 样 一 个 此 动 礼 《用 它 的 变迁 本 数 来 表示 ) 在 输入 正文 工 1.. 可 中 寻找 长 度 为 证 的 模式 
P 的 出 现 倍 嗣 的 过 程 。 对 于 长 度 为 mm 的 模式 的 任意 串 严 配 时 动机 来 说 ， 状 态 集 QQ 为 40，1， 
mi， 初始 状态 为 0， 唯一 的 接收 状态 是 状态 严 。 


FINITE-AUTOMATON-MATCHERIT，5，hm) 
] ns .length[ . 

J 二 < 站 

3 fear il1 to 

二 do < 芒 旭 ， 工 [) 

和 让 蕊 二 吉 

如 then Sn 一 In 
- 


Ptint “模式 出 现 且 位 移 汶 "8 


由 FINITE-ADUTOMATON-MATCHER 的 简单 循环 结 梅 可 以 看 出 , 对 于 一 个 长 度 为 
nm 的 正文 串 ， 它 的 运行 时 间 为 Dan。 但是， 这 一 运行 时 间 没 有 包括 计算 变迁 函数 6 所 钴 营 
的 时 间 。 我 们 将 在 证 明 FINITE-AUTOMATON-MATHE 灵 的 正确 性 以 后 再 米 讨 论 这 一 
问题 . 

考察 自动 机 在 输 和 人 正文 TII..m 上 进行 的 操作 。 我 们 将 证 明生 动机 扫 过 字符 TI 后 其 状态 
为 ctTi)。 因 为 elTi) = 亚当 且 仅 当 卫 =Ti， 所 以 自动 机 处 于 接收 状态 下 当 且 仅 当 模式 上 已 
被 二 描 过 。 为 了 证 明 这 个 结论 ， 我 们 要 利用 下 面 关 于 后 缀 浮 数 e 的 两 条 引 惠 。 

引 理 到 .2 (后 强力 数 不 等 式 ) ”对 任意 串 xX 和 字符 a， 有 ef(xay 失 G(xX) 十 1。 

证 明 : 参照 了 图 34.7， 设 r= 0， 如果 Tr=0， 贡 根据 cf(x) 非 负 , 可 知 结论 【和 志 cx) +1 
显然 满足 。 因 此 我 们 假定 r> 0。 现 在 ， 根 据 ec 的 定 多 有 P,>xa。 所 以 ， 扎 a 从 了 .与 za 的 
末尾 去 掉 后 就 得 到 PP_ 二 x。 因 此 ， 呈 1 过 alx)， 因 为 ef(x)j 是 满足 Pu=x 的 最 大 的 上 值 。 

引 理 34.3 (后缀 郴 数 递 归 引 理 ) 对 任意 串 x 和 字符 a， 如 果 q=cGooj ， 则 efxa) 
一 C 人 (Pa) 。 

证 明 : 根据 c 的 定义 ， 我 们 有 pu=x。 如 图 34.8 .所 示 ，Pua=xa。 如 果 我 们 设 
r= zftxa)， 则 由 引 理 34.2， 得 r 乏 9+1。 关 为 Pa xa，P.xa。 并 且 |Pj| 生 |P.al， 所 以 由 引 理 
了 4.1 可 知已 二 Pa， 由 此 可 得 了 系 cc(Pua)， 即 cf(xalj 去 ctPuaj。 但 由 于 Piaxa， 所 以 同时 有 
atPay 私 a(xaj。 这 就 说 明 ，a(xaj =a(Pua)。 


此 
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图 34.7 引 理 34.2 证 明 过 程 的 图 环 


现在 . 我 们 就 可 以 来 证 明 刻 划 访 匹配 外 动机 在 给 定 的 输入 正文 上 操作 过 程 的 主要 和 定理 
一 人 3 -一 


了 。 如 上 所 述 。 这 个 定理 说 明 自 动机 在 每 一 步 仅 仅 是 记录 迄今 为 止 所 读 人 串 的 后 缀 的 最 长 前 
. 





图 34.8 引 理 34.3 心 明 过 程 的 轴 示 


定理 34.4 如 乐 9 是 如 匹配 息 动 机 关于 一 给 定 模式 P 的 终 态 函数 ，T[1..o] 是 自动 机 的 
输 人 正文 ， 对 i=0，1，…，、n，、 有 (Ti) =afT)。 

证 明 : 对 1 进行 归纳 。 对 ii=0， 因 为 To=s， 定 理 显然 为 真 。 因 此 ，ep(To =aTo) 
一 心 。 

披 设 efTi) =alTi) 成 立 ， 要 证 明 的 是 9 = 一 (Ti 。 设 g 表示 ml(T)，a 表示 
ffi+i， 那 么 


poT ) =eoTa (由 T ， 和 a 的 定义 ) 
=5eT ) ,，a  ( 由 wp 的 定义 ) 
一 以 9，a) (由 q 的 定义 ) 
= 一 5(P，a) (由 6 的 定义 〈34.3) ) 
=a(T;a) (根据 引 理 34.3 和 归纳 ) 
-ofT ，) ( 恨 据 T 的 定义 ) 


根据 归纳 法 ， 定 理 得 证 . 

根据 定理 34.4， 如 果 自 动机 在 第 4 行进 入 状态 q， 则 q 是 满足 P。=T; 的 最 大 值 。 
此 ， 在 第 5 行 有 gq=m 当 且 仅 当 刚刚 扫描 过 模式 了 在 正文 中 的 一 次 出 现 位 置 . 所 以 我 们 可 凡 
得 出 结论 ，FINITE-AUTOMATON-MATCHER 可 以 正确 地 运行 。 


计算 变迁 画 数 
下 列 过 程 根据 一 个 给 定 模式 P1..m] 来 计算 变迁 函 敷 5。 


COMPUTE-TRANSITION-EFUNCTIONIP，zZ) 
1 me…lengthf] 

2 foer qab0 to 血 

3 do for 每 个 字符 aE 工 

村 do ks-iminfm 二 1，q+2) 

5 Tepbeat KK<-k 一 ] 

看 Until 疡 一 下 

了 研 日 ， 昌 ) 不 

名 Teturn 丰 


-一 604 一 


这 个 过 程 根据 定义 直接 计算 5qa，aj。 从 第 2 行 和 第 3 行 开始 的 典 套 循环 考察 所 有 的 状 
态 q 和 字符 a， 第 4-7 行 把 KKq，a) 置 为 满足 P, 二 Pua 的 最 大 的 k。 代 码 开始 时 k 为 可 能 的 
最 大 值 mintm，q+1)。 随 着 过 程 的 执行 ，k 逐渐 递 钴 至 已 >Paa。 

COMPUTE-TRANSITION~-FUNCTION -的 运行 时 间 为 OZ ， 这 是 因为 外 循环 
提供 了 因子 中 2， 内 层 的 repeat 循环 至 多 执行 m+l 次 ， 而 第 6 行 的 测试 莱 >Pua 可 能 需要 
比较 下 个 字符 。 还 存在 这 行 速度 更 快 的 过 程 。 如 果 我 们 能 够 利用 精心 计算 出 的 有 关 模 式 了 
的 信息 ， 巾 根据 P 计算 出 5 所 需要 的 时 间 可 以 改进 为 D(m|z) (参见 练习 34.4-6)。 如 果 有 四 
改进 后 的 过 程 来 计算 6， 则 对 字母 表 王 ， 找 出 长 度 为 吓 的 模式 在 长 度 为 n 的 正文 中 的 所 有 
出 现 位 置 所 需 的 运行 时 间 为 Da 全 |) 。 


34.4 Knuth-~-Meorris 一 Pratt 算法 


我 们 现在 来 介绍 一 种 由 Kunth、Merris 和 Pratt 三 人 设计 的 线性 时 间 串 匹配 算法 。 这 个 
算法 不 用 计算 变迁 函数 58, 运行 时 间 为 @(n+m)j。 它 在 时 间 D(m) 内 根据 模式 预先 计算 出 一 
个 辅助 衣 数 xf1..m]， 然 后 利用 这 个 辅助 函数 来 进行 模式 匹配 。 数 组 x 使 得 我 们 可 以 按 需 要 
-飞快 "而 有 效 地 计算 〈 在 平 捧 意 义 上 来 说 } 变迁 函数 5。 粗 咯 地 说 ， 对 任意 状态 q 一 0，1， 
…， 刀 和 任意 字符 af 研 ，rtq] 的 值 包含 了 与 a 无 关 但 在 计算 5(q，a)y 时 需要 的 信息 。 由 于 
数组 关 只 有 mm 个 元 素 ， 而 5 有 Onmlz 个 值 ， 所 以 我 们 通过 预先 计算 = 而 不 是 5 西 使 时 间 
减少 了 一 个 三 因子 。 


关于 模式 的 前 垦 函数 


模式 的 前 组 畏 数 包含 有 模式 与 其 自身 的 位 移 进 行 匹 配 的 信息 。 这 些 信 息 可 用 于 避免 在 朴 
索 的 串 距 配 算法 中 对 无 用 位 移 的 测试 或 避免 串 匹 配 自动 机 中 对 5 的 预先 计算 过 程 。 
考察 一 下 朴素 的 审 匹 配 算 法 的 操作 过 程 。 图 34.9(a)j 说 明 在 模式 了 =ababaca 和 正文 工 
的 匹配 过 程 中 ， 模 板 的 一 个 特定 位 移 s。 在 这 个 例子 中 ，q= 5 个 字符 已 经 匹配 成 功 ， 但 模式 
的 第 6 个 字符 不 能 与 相应 的 正文 字符 匹配 。q 个 字符 己 经 匹配 成 功 的 信息 确定 了 相应 的 正文 
字符 ，。 知 道 这 q 个 正文 字符 就 使 我 们 能 够 立即 确定 某 些 位 移 是 非法 的 。 在 图 中 的 实例 中 ， 
位 移 s+1 是 非法 的 ， 因 为 模式 的 第 一 个 字符 a 将 与 已 经 知道 与 模式 的 第 二 个 字符 b 匹配 过 
的 正文 字符 进行 匹配 。 但 是 ， 图 中 (bj 部 分 所 示 的 位 移 s+2, 使 模式 的 前 面 三 个 字符 和 相应 
的 三 个 正文 字符 对 齐 后 必定 会 匹配 。 在 一 般 情况 下 ， 知 道 于 列 问题 的 答案 将 是 很 有 用 的 : 
已 知 模式 字符 P[1..q] 与 正文 字符 Ts+1..s+q] 匹 配 ， 那 么 满 中 
P[1..kX]=TIe” +1..s” 十 阿 【34.90) 
其 中 s* +k=s+gq 的 最 小 位 移 s′>s 是 和 多少? 这 样 的 位 移 s”′ 是 大 于 s 的 未 必 非 法 的 第 一 个 
人 位 移 。 在 最 好 的 情 下 ， 我 们 有 s ”=s+q， 因 此 立刻 能 排除 位 移 sl1，s+2， 
s+q-1。 在 任何 情况 下 ， 对 于 新 的 位 移 s″′， 我 们 无 需 把 了 的 前 上 个 字符 与 T 中 相应 的 字符 
进行 比较 ， 因 为 等 式 (34.5) 已 经 保证 它们 肯定 匹配 。 
我 们 可 以 用 模式 与 其 自身 进行 比较 以 预先 计算 出 这 些 必 要 的 信息 ， 如 图 34.9(c) 所 示 。 
由 于 Ts′ -1..s”+Kk: 志 正文 中 已 经 知道 的 部 分 ， 所 以 它 是 串 Pu 的 一 个 后 缀 。 我 们 可 以 把 等 
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式 (34.5》 解释 为 要 求 满 妈 Pu 二 P, 的 最 大 的 攻 <<q。 于 是 ，s′ =sHq-io 就 是 下 -个 可 能 
全 法 的 位 移 ， 已 经 证 明 ， 把 已 匹配 字符 的 数目 k 存储 在 新 的 位 移 s′ (而 不 是 s" -s) 是 比 
较 方 便 的 。 这 些 信息 可 用 于 加 快 朴素 的 串 号 配 算法 与 有 限 自动 机 匹配 器 的 执行 速度 . 
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萎 4.10 引 理 34.5 的 图 示 ， 这 里 模式 了 = abababca，9=8 


我 们 现在 对 护 需 的 预先 计算 过 程 正 式 说 明 如 下 。 已 郑 一 个 模式 P[1..m， 模 式 P 的 前 绥 

天 数 是 评 数 rz: 11，2，…，mj 一 {0，1，…，m- 二 并 满足 
r(q) 一 maxtk :kk<qand Pi 二 P} 

印 刀 qj 是 P。 的 适当 后 缀 了 的 最 长 后 缀 的 长 度 。 又 例如 ， 图 34.10(a) 中 给 出 了 关于 模式 
lbabababeca 的 完整 前 组 函数 r。 、 

下 面 给 出 的 过 程 民 MP-MATCHER 的 伪 代 码 就 是 长 nuth--Morris-Pratt 算法 的 实现 。 
我 们 将 看 到 ， 它 大 部 分 都 是 在 模仿 过 程 FINITE- AUTOMATON- MATCHER， 
必 MP-MATCHER 调用 了 一 个 辅助 过 程 COMPUTE-PREEFIX-FUNCTION 来 计算 r。 


KMP-MATCHERIT，B) 
ne-lentth[Tj] 
me length[] 
TCRPUTE 一 PREFIX--FUNCTIGMNIP) 
马 = 眉 
foer is- to 马 
do whnile qg>0 and Ptlq+llTI 
do q=< r[g] 
这 P[q+]= 工 四 
tbheh 对 < 是] 
放 驴 一 他 
thenm priat“ 模 式 出 现 且 位 移 为 "im 
qflql 


” 本 一 一 
HH 一 辣 姜 了 胸 -机上 一 


LOMEPUTE 一 PRERIX-FUNCTITIONCPE) 


1 me-iength[P] 

2 下-0 

3 了 Ka 中 

4 ftor gs to 

5 do while 友 >0 and 了 P[k+]]P[9] 
右 do 攻 s F[k] 

? 让 呈 [K+ 有 = P[q] 

中 the 和 长 < 长 十 

允 [9]< 
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我 们 先 来 分 析 这 上 两 个 过 程 的 运行 时 间 , 对 其 正确 性 的 证 明 要 复杂 一 些 。 
运行 时 间 分 析 


运用 平 挫 分 忻 方法 〈 人 参见 第 十 八 章 ) 进行 分 析 后 可 知 , 过 程 COMPUTE-- PRERIX 一 
FUNCTION 的 运行 时 间 为 Dom)。 我 们 把 k 的 势 与 算法 中 当前 状态 大 联系 起 来 。 根 据 第 3 
行 、 该 势 的 初始 值 为 0。 因为 r[kg] <k， 所 以 每 当 执 行 第 6 行 时 k 值 递 减 。 但 是 ， 因 为 对 所 
有 K，zf[k} 关 0， 所 以 k 不 可 能 变 成 负 值 。 对 k 值 产生 影响 的 另 一 行 代码 就 是 第 8 行 ， 在 每 
次 执行 far 循环 体 时 该 行 至 多 使 k 增加 1。 因 为 进行 for 德 环 时 X<q， 并 且 因 为 在 fer 循环 
体 的 每 次 只 代 过 程 中 q 的 值 都 增加 ， 所 以 kx<gq 总 成 立 。( 根 据 第 8 行 ， 这 也 同时 说 明 


一 一 匡 们 了 一 一 


rlqj<q 是 正确 的 .) 由 于 r[k]<kxk， 所 以 每 次 执行 第 6 行 中 while 循环 体 我 们 所 得 到 的 结果 
就 是 势 本 数 的 几 应 减少 。 第 8 行 至 多 把 势 函 数 增加 1， 因 此 第 和 -9 行 循环 体 的 平 摊 代 价 为 
OU1)。 由 于 外 层 循 环 迁 代 的 次 数 为 O(tm)， 并 且 最 终 的 势 本 数 至 少 与 初始 势 函 数 一 样 大 ， 所 
以 实际 最 坏 情 况 下 COMPUTE - PREFIX -~- FUNCTION 的 全 部 运行 时 间 为 DO(m). 

下 nuth- Morris 一 Pratt 算法 的 运行 时 间 为 Onm+nl 。 我 们 刚才 已 经 看 到 调用 
COMPUTE-PREFIX-FUNCTION 所 需 的 时 间 为 Otm)] ， 在 类 似 的 平 捧 分 析 中 ， 如 果 用 日 
的 值 作为 势 函 数 ， 则 执行 KMP-MATCHER 的 剩余 部 分 所 需 的 时 间 为 DCn) 

与 FINITE-AUTOMATON-MATCHER 相 比 ， 通 过 运用 r 而 不 是 5， 可 使 对 模式 进 
行 预 处理 所 需 的 时 间 由 Qtmlzl) 下 降 为 D(m)， 同 时 保持 实际 的 匹配 时 间 为 DO(m+n) 。 


前 缓 函 数 计算 过 程 的 正确 性 


我 们 先 证 明 一 个 重要 引 理 ， 它 说 明 通 过 对 前 组 函数 zx 进行 迭代 ， 就 能 够 列举 出 是 某 给 

定 前 缀 P, 的 后 缀 的 所 有 前 缀 瑟 。 设 
fr [q= 人，x[qj，z[g， 关 [加 ，x[q]} 

其 中 [q] 是 按 复合 画 数 的 概念 来 定义 的 ，re[q]=q，x1q]=z[xi[qj，i> 1， 并 且 当 达到 
ttqj=0 时 ，r [g] 中 的 序列 就 终止 。 

引 理 34.$ (前 缀 函数 迭代 引 理 ) ” 设 P 是 长 度 为 上 mn 的 模式 ， 其 前 继 画 数 为 r， 对 
q=1，2，…，m， 有 天 [ 辐 = 人 长 : PP。}。 

证 明 : 我 们 先 证 明 

如 果 二 [qj]， 则 疡 Pa (34.6) 

苦 太 天 [gj， 则 对 某 个 u， 有 i= xfql]。 我们 通过 对 u 进行 归纳 来 证 明 式 〈34.6) 成 立 。 对 
u=0， 我 们 有 i=q， 因 为 Pu=P， 所 以 断言 成 立 。 利 用 关系 Pai==Pi 和 的 传递 性 , 就 可 以 
证 明 对 所 有 icz*[q] 断 言 都 成 立 ， 因 此 ，r*[qljs 化 : PP， 
”我 们 通过 引信 了 矛盾 来 证 明 {k : gk >>PEr [qlj， 假 设 相 反 地 存在 一 个 整数 属于 集合 共 : 
败 二 Pu} 一 mr [gl]， 并 设 j 是 最 大 的 这 样 一 个 值 。 因 为 qE fk : PP 站 [qq]， 所 以 j<q， 
此 我 们 设 j ”表示 r"[q]j 中 比 j 大 的 最 小 整数 。 (如 果 普 " [q] 中 没有 其 他 数 比 j 大 ， 则 我 们 可 以 
选取 j”=q.) 

我 们 有 于 Pu， 因 为 j6 tk : 怀 =P}， 另 外 还 有 Pi， 二 P,， 因为 人 帮 、 中 ]。 六 此 ， 根 据 
引 理 4.! 有 Pi 二 P- 

此 外 ， j 是 油 是 该 性 质 的 最 大 值 . 因此 我 们 必定 有 台 ?]- 一 j， 因此 jem [ql]。 这样 就 产 
生 耶 盾 ， 所 以 引 理 保证 。 

图 34.10 说 明了 该 引 理 。 

算法 COMPUTE-PREFIX-EUNCTION 根据 q=1，2，…，am 的 顺序 计算 rx[q] 的 
值 ，COMPUTE-PREFIX-FUNCTION 的 第 2 行 中 的 计算 x[1]=0 当然 是 正确 的 ， 因 为 对 
所 有 q，zxlql<q。 下 列 引 理 其 推论 将 用 于 证 明 对 q> 1，COMPUTE- PRERIX- FUNC- 
TION 能 正确 地 计算 出 z[q]。 

引 理 34.6 设 P 是 长 度 为 的 模式 ,xz 是 P 的 前 缀 画 数 。 对 q=1，2，…，m， 如 果 
zfq]j>0， 则 xf[q]-14 z 反 一 口 。 

证 明 : 如 打上 =rlqj>0， 则 PR>PJ， 因 此 Pei>P (把 P 和 了 , 中 的 最 后 一 个 字符 去 
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掉 )， 因 此 ， 根 据 引 理 34.5 可 得 k-16r*[q-]]. 
对 q=2，3，…，m， 定 义 子 集 FE_iEx*Iq 一 1 雯 
Eq- 一 在 :kCr*[q-HU 且 P[k+=plq]} 
集合 E。, 由 满足 P 二 P。_， (根据 引 理 34.5) 的 k 值 组 成 ; 因为 PIk+1]= P[q]， 所 以 对 
这 些 k 值 则 样 有 Pi,= P.。 直 观 上 ，E,_, 由 那些 我 们 可 以 把 Pu 扩充 到 P.,, 并 得 到 P, 的 一 
个 后 妥 的 KE x* [q 一 贡 值 组 成 。 
推 沦 347 ” 设 了 是 长 度 为 四 的 模式 ， 5 扯 的 前 缀 函数， 对 q 一 2， 3，…，m 


xlq] 一 [aas 1 如 果 E。， 产 申 

证 明 : 如 果 T+=r[qlj]， 则 P,=P.， 因 此 由 rz1 理 含 Pir]=P[qlj。 根据 引 理 34.6， 如 果 T 沁 

1， 则 

r= 一 1+max { 攻 Ex [q 一 1 : P[k+H=Plqh} 
但 上 式 取 最 大 值 的 集合 就 是 E_1， 所 以 r= 1HmaxfkC E。j} 并 且 E。，); 非 空 。 如果 r=0， 则 
不 存在 KK& rr [q 一 贡 , 使 我 们 能 把 Pk 扩充 到 Pu 并 得 到 P, 的 一 个 后 缀 ， 因 为 如 果 这 样 的 话 ， 
我 们 就 得 到 r[qgj]> 0。 因 此 ，E。, = 中 。 

我 们 现在 来 完成 对 COMPIUTE-PREFIX-FUNCION 的 正确 性 证 明 。 在 过 程 COML- 
PUTE-- PREEIX-- FUNCTION 中 ， 第 4-9 行 for 循环 的 每 次 选 代 开 始 时 ， 我 们 有 
k =F[q 一 1]。 当 第 一 次 进入 循环 时 ， 该 条 件 由 第 2 行 和 第 3 行 实现 ， 并 且 因 为 第 9 行 的 执行 
使 该 条 件 在 下 面 的 每 次 达 代 中 均 保 持 成 立 ， 第 和 8 行 调整 X 的 值 使 它 变 为 现在 的 r[q] 的 正 
确 值 。 第 和 6 行 的 循环 搜寻 所 有 ET [q-]] 的 值 , 直至 有 一 个 KK 值 满 足 P[k+1]= P[q]; 这 
时 是 集合 E。; 中 的 最 大 值 。 筑 此 由 推论 34.7， 我 们 可 以 置 xz[qj] 的 值 为 k+1。 如 果 没 有 找 
到 满足 条 件 的 k， 则 第 7-9 行 中 k=0， 因 此 也 把 x[qj 的 值 王 为 0。 这样 我 们 就 完成 了 对 
COMPUTE-PREFIX-FUNCTION 的 正确 性 的 证 明 。， 


天 MP 算法 的 正确 性 


过 程 陈 MP-MATCHER 可 以 看 作 是 过 程 FINFTE--AUTOMATON-MATCHER 的 一 
次 重新 实现 。 我们 将 证 明 KMP- MATCHER 的 第 6-9 行 的 代码 与 
FINITE-AUTOMATON-MATCHER 的 第 4 行 代码 (把 q 的 值 杰 成 Kgq，T[il)) 是 等 价 
的 。 在 KMP 算法 中 , 我 们 并 不 是 利用 存储 的 值 6q，T[D)， 而 是 在 需要 时 ， 根 据 r 重新 计 
算出 该 值 。 一 下 我 们 证 明了 KMP-MATCHER 模拟 了 FINITE- AUTOMATON 一 
MATCHER 的 操作 过 程 ， 自 然 也 就 可 以 由 FINITE- AUTOMATON-.MATCHER 的 正 
确 性 推导 出 KMP-MATCHER 也 是 正确 的 (但 是 下 面 我 们 将 厦 到 为 什么 KMP-MATCH- 
ER 中 的 第 12 行 代 码 是 必 短 的 ) 。 

KMP-MATCHER 的 正确 性 可 由 以 下 断言 推 得 : 或 者 6(q，Tfil) =0， 或 者 5q， 
TI -1K&r [ql]。 为 了 检查 该 断言 的 正确 性 ， 我 们 设 X=5Qq，TI。 根 据 5 和 的 定义 有 PR 
=PsTH。 因 此 ， 去 掉 PR 和 PsT 轩 的 最 后 一 个 字符 后 〈 这 时 k-1gr [qh， 或 者 有 K=0， 或 
者 有 ks1 并 且 P， ,二 P,。 所 以 ， 或 者 k=0， 或 者 k-16Er*[ql]。 断 言 得 证 

现在 我 们 按 如 下 方法 运用 该 断言 。 设 q”′ 表示 进 人 第 6 行 时 qd 的 值 。 我 们 用 等 式 


zf[g={k: 已 P} 来 证 明 途 代 q<-r[lqj 可 以 校 举 出 集合 长 : PP } 中 的 元 素 。 第 6-9 行 
通过 按 递 减 顺 序 检 查 zx "19 ] 中 元 素来 决定 58(q”，TIm) 的 值 。 运 用 上 述 断 言 ， 伐 码 开 始 有 
q4=etT D =oT )， 并 且 执 行 迷 代 操 作 q< 吉 9 喜 至 找 出 一 个 qg 满 足 g=0 或 者 
pliq+1= 工 ij。 在 前 一 种 情况 下 ， 有 &q ” ，Tti) = 避 在 后 一 种 情况 下 ，q 是 Eu 中 的 最 大 
元 素 ， 因 此 由 推论 34.7 有 5qg ”，T6]) =q+1.。 

在 必 MP-MATCHER 中 , 必须 要 有 第 12 行 代码 是 为 了 避免 在 找 出 P 的 一 次 出 现 后 第 6 
往 中 可 能 出 现 Prm+l 的 情形 。( 由 练习 34.4-6 的 提示 : 对 任意 atE 工 ， 我 们 有 6m，a) 
= 二 ztmI，a， 或 者 等 价 业 有 efP,) =eaftP sa)， 我 们 可 以 推 得 在 下 一 次 执行 第 6 行 代码 时 
q=otT_)》 依然 保持 合法 .) 关于 区 nuth-Morts-Pratt 算法 的 正确 性 证 明 中 , 其 余 的 部 分 可 
以 从 FINITE-AUTOMATON-MATCHER 的 正确 性 推 得 ， 因 为 更 在 我 们 可 以 看 出 
KMP-MATCHER -模拟 了 FINITE-AUTOMATON-MATCHER 的 操作 过 程 。 


34.5 Boyer--Moore 算法 


如 果 模 式 P 相对 较 长 , 字 岂 表 工 也 很 大 ， 此 时 最 有 效 的 串 匹 配 算 法 应 该 是 由 Robert 
S.Boyer 和 JStrother Moore 所 提出 的 算法 。 


BOYER-MODDORE-MATCHSERTT， 卫 ， 也 ) 


1 ne-lenmegthfT] 
3 _ Im-Ieneth[P|] 
3 各 COMPUTE-LAST-OCCURRENCE-FUNCTIONIP，m，》 ) 
二 3 RD 下 下 一 全 人 人 一 SHEFI 人 一 FUMNCTICMNE，2) 
3 3 
在。 WHi 陀 裤 TI 
了 do 姑 - 
及， wbie ]>0 and POD=TisHjj 
久 慎 1 
10 if j=6 
11 then Piint “模式 出 班 于 位 移 "s 
12 Sm -人 十 4[ 全 
13 etse se smaxfy、 人 2LT[s+H) 


除了 看 来 有 些 神秘 的 4 和 s 之 氏 ， 这 个 程序 很 像 朴 案 的 串 死 配 算法 。 假 定 我 们 拿 掉 第 
3-4 行 . 并 把 第 12-13 行 对 s 全 的 更 新 代 之 以 于 列 的 简单 票 加 : 
12 Sa 二] 
13 else 8S<-S 二 1 
经 过 这 样 依 改 后 的 程序 执行 起 来 就 与 朴素 的 串 焉 配 算 法 很 相 他 : 第 6 行 开始 的 while 循 
环 依次 考察 n--m+l 种 可 能 的 位 移 sS， 第 8 行 开 始 的 循环 通过 比较 Bi 和 Ts+iG=m,， 
m-i，…，、1 的 值 来 测试 条 件 FL1..m]= IT[s+1..s+mj。 如 果 该 循环 和 终止 时 j= 0， 则 一 个 合法 
位 移 s 己 被 发 现 ,第 11 行 打印 出 s 的 鸽 。 就 此 说 来 ，Boyer 一 Moore 算法 唯一 引 人 注 目的 特 
点 就 是 它 从 石山 霸 把 模式 与 正文 比较 ， 并 且 在 第 12--13 行 中 它 使 位 移 s 增加 的 值 不 一 定 为 
1 。 


Boyer 一 Moeere 算法 中 采用 了 丙种 启发 性 方法 ， 如 免 了 先前 的 那些 让 匹配 算 法 中 执行 的 
证 多 工作 。 这 两 种 忆 发 性 方法 非常 有 效 , 它们 使 算法 完全 路 过 了 对 许 儿 正文 字符 的 检查 .这 
两 种 局 发 性 方法 分 别称 为 * 二 字符 启发 性 方法 "和 "好 后 缀 启发 性 方法 "， 图 34.11 对 它们 进行 
了 说 明 。 它 们 的 操作 可 看 作 是 独立 地 并 行 热 行 的 。 当 出 现 不 匹配 情况 时 ， 每 一 种 启发 性 方法 
都 担 遇 一个 数额 ， 根 据 该 数额 我 们 可 以 交心 地 增加 s 值 , 并 不 会 错过 任 梧 合法 和 位移。 
Royer- Moore 算法 在 两 个 数 富 中 选取 较 大 的 一 个 并 把 它 与 值 相 加 ; 出 更 不 匹配 情况 后 执 





下 的 
3 
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图 34.11 Boyer-Moore 启发 性 方法 的 图 示 


坏 字 符 启 发 性 方法 


当 发 生 不 匹配 情况 时 、 坏 字符 启发 性 方法 利用 有 关 坏 正文 字符 在 模式 中 出 现 的 位 置 【如 
果 它 的 确 出 现 ) 的 信息 来 建议 新 的 位 移 。 在 最 佳 情况 下 ， 不 号 配 情 况 出 现 于 第 一 次 比较 中 
(P[m] 拓 Tfs+mj) 并 玫 坏 字符 根本 没有 在 模式 中 出 班 《 设 想 在 正文 中 bz 中 搜寻 模式 ar。 在 
这 种 情况 下 ， 我 们 可 以 把 位 移 s 增加 m， 国 为 任何 小 于 s+m 的 位 移 都 会 使 某 个 模式 字符 与 
坏 字 符 对 齐 从 而 导致 不 匹配 情况 出 现 。 如 果 最 佳 情 形 反 复出 现 ， 那 么 Boyer-Moore 算法 仅 
址 对 1 “了 的 正文 字符 进行 检查 ， 因 为 检查 的 每 一 个 正文 字符 都 出 现 不 匹配 情况 ， 因 而 使 s 
增加 m， 这 一 最 佳 情形 下 的 操作 过 程 说 明了 从 右 到 左 匹配 取代 从 左 到 右 匹 配 的 威力 。 

在 一般 情况 下 ， 坏 字符 启发 性 方法 执行 如 下 。 和 假设 我 们 刚刚 发 现 一 个 不 匹配 字符 : 对 某 
个 j 有 P0] 寺 [sHi]， 其 中 1 和 ij 和 m。 接 着 设 k 是 在 1<ksain 的 范围 内 且 满 足 T[sH]= [9 的 最 
大 下 标 〈 如 果 存 在 任何 这 样 的 k) 。 否 则 ， 设 KK=0， 断 言 可 以 安全 地 把 s 增加 i-Kk。 为 了 证 
明 该 断 旧 戌 立 ， 我 们 必须 考虑 三 种 情况 ， 如 图 34.12 所 示 。 


一 611 一 


和 nx characler 二 





4 十 于 和 
zsTnTiTsTiTsTe[sTslsrs 


[0 


_， -GEETEETITITEEETm 


扣 下 示 








疯 34.12 ” 坏 符 忆 发 性 方法 的 情况 


k=0 如 图 34.12(a) 所 示 ， 坏 字符 T[s+j] 根 本 没有 在 模式 中 出 现 ， 因 此 我 们 可 以 安 
全 地 把 s 增加 j 而 不 会 错过 任何 合法 位 移 。 

-< 如 图 34.12(b) 所 示 ， 坏 字符 在 最 后 边 出 现 的 位 置 在 模式 中 处 于 j 的 左边 ， 因 此 
有 计 k>80， 并 且 模 式 必须 向 右 移 动 六 k 个 字符 才能 使 坏 正文 字符 与 任何 模式 字符 匹配 。 因 
此 ， 我 们 可 以 安全 地 把 s 增加 六 K 而 不 会 错过 任何 合法 位 移 . 

> 站 如 图 34.12(c) 所 示 ，jk<0， 因 此 坏 字 符 启 发 性 方法 实质 上 建议 减 小 s 的 值 。 
而 Boyer-Meoore 算法 将 忽略 这 一 建议 ， 因 为 在 所 有 情况 下 好 后 绥 启 发 性 方法 都 将 建议 一 个 
向 右 的 位 移 。 

韦 列 简 单程 序 定 浆 ia] 为 对 每 个 ak 工 ， 字 符 a 在 模式 中 出 现 的 最 右 位 置 的 标号 。 如 果 a 
没有 出 现在 模式 中 ， 则 把 4[a] 轩 成 0。 我 们 称 4 为 模式 的 最 后 出 现 函 数 。 运 用 这 一 定义 、 过 
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蛙 BORER-MOORE-MATCHER 中 第 13 行 的 表达 式 六 41T[s+ 让 实现 了 坏 字 符 启 发 性 方 
内 。《 因 为 如 果 坏 字符 T[s+j] 在 模式 中 的 最 右 出 现 位 轰 在 位 置 j 的 右边 ， 那 么 j 一 MT[s+ 刘 的 值 
为 负数 ， 所 以 这 时 我 们 就 要 依赖 好 后 缀 启发 性 方法 所 建议 的 刘 ] 为 正 的 性 质 来 保证 算法 在 每 
一 步 都 能 向 前 执行 .) 


CORNPUTE-LASTIT 一 CCURRENCE--FUNCTIONIP，m， 工 ) 
1 for 每 个 字符 和 荆 
2 do 对 [a]<- 人 0 

3 for jl to mm 

4 do 4i[P 吕 <j 
Tetutm 丰 


过 程 COMPUTE-LAST-OCCURRENCE-FUNCTION 的 运行 时 间 为 D(2Hm) . 
好 后 缀 启发 性 方法 


让 我 们 定义 有 关 串 QQ 和 串 R 的 关系 ~ 有 ( 读 作 中 相似 于 R) 为 Q=R 或 尺 >2Q。 如 
果 两 个 串 相 似 ， 则 可 以 让 它们 按 匹 配 的 最 右 字符 对 齐 , 上 且 没 有 一 对 对 痢 的 字符 是 不 匹配 的 。 
关系 “~ "是 对 称 关 系 : Q 一 及 当 且 仅 当 R~Q， 作 为 引 理 34,1 的 推论 ， 我 们 也 有 
Q 二 RR 并 且 S$>=R 可 推 得 Q~S (34.7) 
如 果 发 现 P[#Tfs+j]， 其 中 j<m， 网 好 后 绥 月 发 性 方法 告诉 我 们 可 以 安全 地 把 $ 增加 
3? 全 =m 一 max 信 :0 和 k<m 有 了 [1 一 P 
即 谭 ] 是 我 们 可 以 增加 s 而 不 会 使 “好 后 倒 "T[s+j+l..s+im] 中 的 任何 字符 不 能 与 重新 对 齐 后 的 
异 式 进行 匹配 的 最 小 值 。 对 所 有 j， 郴 数 》 都 有 完备 定义 ， 这 是 因为 对 所 有 j 有 P[ji+L..m] 一 
P: 空 串 相似 于 所 有 的 串 。 我 们 称 是 模式 P 的 好 后 级 本 数 。 
现在 我 们 来 说 明 如 何 计算 好 后 缘 函 数 ?。 我 们 首先 注 瘟 到 对 所 有 j， 放 ] 乏 mr[m]。 如 果 
w=~ 研 mm]， 则 根据 zx 的 定义 有 Pu,=P。 此 外 ， 因 为 对 任意 j 有 P[j+1l.m]=P， 所 以 根据 式 
(34.7) 有 PP 一 PU+1..ml。 友 此， 对 所 有 j 有 叶 志 in 一 rzr[m] 成 立 。 
现在 可 以 把 的 定义 重 写 为 
间 ] 三 m 一 max 人 tk : rm 和 k<aim 且 了 Pi+lm] 一 P} 
如 果 Pi+1..m] 二 P, 成 立 或 者 P, 己 P[U+1..m 成 立 ， 那 么 条 件 Pi+l..mj 一 P, 就 成 立 。 但 由 
后 一 种 可 能 性 可 以 推 得 ==P， 因 此 根据 r 的 定义 有 : kk 过 xm]。 在 这 后 一 种 可 能 性 中 ， 区 ] 
的 值 不 可 能 减 小 到 小 于 mm-rm]。 因 此 我 们 可 以 进一步 改写 7 的 定义 如 下 : 
?而 =m-max(z[rm WUkk :ziml<k<m 且 了 PU+l.m] 二 Pe) 
(第 二 个 集合 可 以 为 空 集 .) 下 面 一 点 很 值得 我 们 注意 : 该 定义 说 明 对 所 有 j=1，2，…， 
m， 诈 ]> 0， 这 就 保证 了 Boyerc-Moore 算法 能 够 向 前 执行 。 
为 了 进一步 简化 y 的 表示 ， 我 们 定义 PP 为 模式 了 的 道 横 式 ，x ”为 相应 的 前 绷 函 数 ， 
即 ，P ”向 = Pbm 于 ]J],i=1I，2，…，zin， 天 ” 旧 是 满足 u<t 且 和 ,二 P” ,的 最 大 的 u。 
如 果 K 是 满足 Pi+l,.m]=P, 的 可 能 的 最 大 值 ， 我 们 断言 
”由 三 mm 一 (34.8) 
其 中 1= mb 二 (mn 一 得 。 为 了 说 明 该 断言 有 完备 定义 ， 注意 ， 由 P[+L Jp] 二 P， 责 可 知 mm 一 j 私 
kt， 因 此 1 乏 冲 。 同 时 ，j<m 并 且 < 和 m， 所 以 1>1。 我 们 现在 证 明 该 断言 如 下 。 因 为 
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PU+1..m 二 PR， 所 以 我 们 有 P ”wj>P ”1。 因 此 ，r 7” 目 关 m-j。 现 在 盘 设 p> m-j， 其 中 
p= 一 rt。 则 根据 二 的 定义 ， 我 们 有 了 “” ,=P ”1,， 或 者 等 价 籽 有 PP “ [1..p]= 了 7” [pH1.]]。 朋 
P 来 改写 该 等 式 后 ， 有 Pfm-p+1..m] =P[m-tH-1..m-I+Hp。 用 1= 2m-k 一 j 替换 后 ， 得 到 
P[m~ pHl.m]=P[k-m+i+1Lk-m+jFp]， 这 说 明 P[m~p+l.m] 二 Pi。 因为 中 >m-j， 所 
以 有 计 1>m-prl， 因 此 BP[j+l.m] 汪 P[m-p+l.ml， 根 据 二 的 传递 性 可 得 P[j+1..m] = 
Pk-mritp。 最 后 ， 由 于 P>m-j， 有 kX”>Xx， 其 中 K”′=k-m+j+p, 这 与 我 们 选择 k 是 满足 
BPU+1..m 叫 二 P 的 最 大 值 相 耶 盾 。 这 就 意 蛛 着 不 可 能 有 P>m 一 ， 因 此 pp=m 一 ， 这 样 就 证 明 
了 疡 言 (34.8) 。 
利用 式 (34.8)， 并 注意 到 天 目 = m 一 蕴含 j=m-xr “外 并 且 k=m-HHz 7 岂 ， 我 们 就 可 
以 把 y 的 定义 进一步 改写 为 
?国王 一 max({r[m]} 
Uilm-1+zrI:1 志 1 入 下 目 j=m 一 交加)) 
= Imin(tm 一 zx[m]} 
UL 一 问 有 :1 入 1 世 mm 上 且 j= 半 一半 )》 ， 《34.9) 
其 中 第 二 个 集合 依然 可 以 为 空 集 。 
现在 我 们 就 可 以 考虑 计算 ? 的 过 程 了 。 


COMPUTE-GOOD-SUFFIX-FPUNCTIONIP，m) 
r<-COMPUTE-PREFIX-FUNCTIONIP) 


1 

2 P'* -< REVERSEp) 

3 T” < CDOMPUTE-PREFIX-FUNCTIONIP ) 
4 for je0 to 了 

5 do 罗 ]<m 一 z[m] 

6 for ll to an 

了 do 入 im” 0] 

8 这 条]>1 天 xz 站 

9 then 轴 ]<-Fx 7 中 


IO retutn 9? 

过 程 COMPUTE-GOOD-SUFFIX-FUNCTION 是 对 式 (34.9) 的 直接 实现 , 其 运行 
时 间 为 Ofmy) 。 

Boyer 一 Moore 算法 在 最 坏 情 况 下 的 运行 时 间 为 On-~-m+1) mr+lzh)， 这 是 因为 COML- 
PUTE~ LAST- OCCURRENCE- FUNCTION 所 需 时 间 为 OUm+| zl ) ， 过 程 
COMPUTE-GOOD-SUFFIX-FUNCTION 所 需 的 时 间 为 Otm)， 并 且 Boyer-Moore 算 
法 〈 与 Rabin-Karp 算法 相似 ) 证 实 每 个 合法 位 移 s 所 需 的 时 间 为 On). 但 是 ， 在 实际 度 
用 中 ， 我 们 常常 选中 Boyer--Meoore 算法 来 解雇 串 匹 配 问题 . 


思 考 题 
34-1 基于 重复 因子 的 串 匹配 算 


设 站 表示 襄 y 与 其 自身 并 置 i 次 所 得 的 结果 。 例 如 (ab) 3= ababab。 如 果 对 某 个 串 y 
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和 王 " 和 某 个 f>0 有 x= 交 ， 则 我 们 说 时 xEZ "具有 重复 因子 r。 设 ptx) 表示 满足 x 具 有 重 
复 因子 TY 的 最 大 值 r。 

a. 写 出 一 有 效 算 法 以 计算 出 p(P) ,i=1，2，…， 丘 ， 算 法 的 输入 为 模式 P[1..m]。 算 法 
的 运行 时 间 是 多 少 ? 

b. 对 任何 模式 P[1..m， 设 P"(P) 定义 为 maxiei<ap(Pi)。 证 明 : 如 果 从 长 度 为 下 的 所 

有 二 进 制 串 所 组 成 的 集合 中 随机 地 选取 模式 P、 则 pP”(P) 的 期 望 值 为 DT) 。 

c. 论证 下 列 串 匹 犯 算法 可 以 在 O(p " (P) mhm) 的 运行 时 间 内 正确 地 找 出 模式 了 在 正文 

Tfl..o 中 的 所 有 出 现 位 置 。 


REPETITION-MATCHERIP，T) 
im 一 length[P] 
n<--]ength[Tj 
k< 一 1+P(P) 
中 < 一 让 
sS= 妨 
While SS 近 一 ML 

do 让 Ts+q+Hi=P[q+]] 

then 妇 < 人 十 

9 计 昌 王 各 
IO then Print“ 模式 出 现 ， 位 移 为 "8 
11 让 q=m or 于 [s+q 二 ti 六 PIN+]] 
12 then Se -shmaxfl，Trqgxx]) 
13 9 . 


~ Sn 


该 算法 是 Gatil 和 Seiferas 提出 的 。 通 过 对 这 些 设计 思想 进行 大 重地 扩充 ， 他 们 得 到 了 
一 个 线性 时 间 的 申 匹 配 算 法 ， 该 算法 除了 了 和 工 所 要 求 的 存储 空间 外 仅 需 DO(D 的 存储 空 
间 . 


”34-2 并 行 串 匹 配 


在 一 台 并 行 计算 机 上 考 忠 关于 上 串 匹 配 的 问题 。 假 定 对 于 一 给 定 模式 ， 我 们 有 一 台 状 态 集 
为 轧 的 串 匹 配 自动 机 M. 设 中 是 M 的 终 态 函数 ， 假 定 我 们 的 输入 正文 是 T[1..m]， 我 们 希 
望 计 算出 pi)，i=1，2，…，n， 芭 我 们 希望 计算 出 每 个 前 缀 的 最 终 状 态 。 我 们 的 策 覆 是 
运用 30.1.2 节 中 撒 述 的 并 行 前 缘 计 算 过 程 。 

对 于 任意 输 和 人 串 x， 我 们 定义 函数 6. : QQ 满足 以 下 条 件 : 如 果 M 开始 于 状态 q 并 
读 人 输 信 x， 则 M 终止 于 状态 5 (q)。 

a. 证 明 :6，。&= 0， 其 中 。 表 示 画 数 复合 : 一. 

(5，。 85) (qj) 一 5(5(q)) 
.b. 论证 ″ 。 "满足 结合 律 。 

c. 论证 在 一 台 CREW PRAM 上 ， 根 据 0. 和 85 的 表格 表示 法 我 们 可 以 在 D(1) 的 时 间 
内 计算 出 6.,， 试 分 析 需 要 多 少 处 理 器 (用 马 表 示 )。 

d. 证 明 etTi) =5r(qoy， 其 中 qd 是 M 的 初始 状态 。 

e, 试 说明 在 一 侣 CREW PRAM 上 如 何在 DO(1gn) 的 时 间 内 找 出 一 个 模式 在 长 度 为 
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的 正文 中 的 所 有 出 现 位 置 。 假 定 该 模式 是 用 相应 的 串 匹配 自动 机 的 形成 提供 的 。 
练习 三 十 四 


34.!-1 试 说 明 当 模式 P=0001,， 正文 T= 000010001010001] 时 ，NAIVE - STRING - MATCHER 
所 技 行 的 比较 。 

34.1-2 证 明 在 最 坏 情 况 下 NAIVE-STRING-MATCHER 找 出 一 个 模式 在 正文 中 第 一 次 出 现 的 位 置 
所 需 的 时 间 为 Bon 一 m+lim 一 1 。 

34.1-3 盆 设 模式 P 中 的 所 有 字符 都 是 不 则 的 。 试 说 明 如 何 对 -- 段 个 字符 的 正文 了 加 速 过 程 
NAIVE-STRING-MATCHER 的 执行 速度 ， 使 其 运行 时 间 达 到 Ca] 。 

34,1-4 候 定 模式 PP 和 工 是 长 度 分别 为 妇 和 nm 的 随机 选取 的 惠 ， 其 字符 山 于 ,d 个 元 素 的 字母 袁 
工 ,= {0，1，…， 二 其 中 gd 关 2。 证 明 朴 索 算 法 第 4 行 中 条 售 的 循环 所 执行 的 字符 比较 的 预计 次 数 为: 


ma-m+nlLd <2n-m+D 





【假定 一 旦 发 现 一 个 不 匡 豆 字 符 世 天 个 模 坟 已 被 押 时 朴素 算法 就 终止 对 : 于 给 定位 移 的 字符 比较 过 
可 .) 这 个 结论 说 明 ,. 对 随机 选 卫 的 串 来 说 ， 朴 素 算 法 还 是 相当 有 效 的 ， 
34.1-S$ ”假设 我 们 允许 模式 P 包 售 一 个 间 隋 字符 作 ， 该 字符 可 以 与 任意 的 字符 吝 匹配 〈 其 至 可 以 与 长 
度 为 0 的 申 匹 配 )。 全 如， 模式 abk>bacd2e 在 正文 cabccbacbacab 中 的 出 现 为 ， 


C ab cc ba cba CC ahb 
ab < ba < “ 
和 
& ab ccbac ba ab 
ab “< ba <> 5 
注音， 间隔 字符 可 以 在 模式 中 出 王 任 意 次 但 根 定 它 不 会 出 现在 正文 中 ， 试 给 出 一 个 多 项 式 运行 时 季 的 
算法 以 确定 这 样 的 模式 也 是否 出 现 士 给 定 的 正文 工 中 ， 并 分 析 你 的 算法 的 运行 时 间 。 


双 2-1 如 果 卫 模 g=11， 那 么 当 尿 abin 一 Karp 匹配 算 潜 在 正文 T= 314159653589793 中 搜寻 模式 
PB=26 财 会 过 到 多 少 个 伪 命 中 点 ? 

34.2-2 如 何 扩 捷 Rabin-Karp 方法 使 其 能 解决 这 样 的 问题 : 如 何在 亚 文 串 中 搜寻 出 给 定 的 k 个 模式 中 
妊 何 一 个 的 出 现 位 置 ? 

了 34.2~3 试 说 明 如 何 扩 展 Rabin- 民 atp 方法 以 处 理 下 列 问题 : 在 一 全 nxnm-2… 维 字符 组 成 的 数组 中 搜寻 
一 个 给 定 的 锯 x 问 模式 。{ 可 以 使 该 模式 在 水 平方 向 和 重 直 方向 移动 ， 但 不 可 以 把 模式 旋转 .) 

34.2-4 Alice 有 一 份 很 长 的 na 位 文件 的 复印 件 ， 和 = 《ai，a ，…，a>》，Bob 也 有 一 份 类 极 的 文 
件 B= 《bi，bo oo，…，bo>。Alice 和 Bob 都 希望 知道 他 们 的 文件 是 否 一 样 。 为 了 避免 传送 整个 文件 A 或 
B， 他 和 们 运用 了 - K 列 快速 或 然 性 检查 手段 ， 他 们 一 起 选择 一 个 罕 数 q> 1000n， 并 从 !0， 1，…，n 一 二 中 随机 
选取 一 个 整数 x， 栋 后 ， 点 1ice 求 出 

Al(x) 一 yax 】 mod 


的 值 , Bob 也 用 类 似 方法 计算 出 Bx)。 证 明 :; 如 果 A 二 B， 则 A(x) = B(x) 的 概率 至 多 为 17 1000; 如 果 丙 
个 文件 相同 ， 则 A(x) 的 值 必 定 等 于 B(x) 的 值 。( 握 未 ， 参 见 练习 33.4-4) 


34.3-1 对 复式 了 =aabab 构造 出 相应 的 串 匹 配 自 动机 ， 并 说 蝎 它 在 正文 串 T= aaababaabaababaab 
上 的 操作 过 程 。 
4,.32 对 字 峡 玫 瑟 = 则 ，tb， 画 出 与 模 趟 
ababbabbababbababbatbb 
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相应 的 昌 吃 配 各 动机 的 状态 转换 图 . 

34.3-3 如 果 由 二 Pu 莉 合 k=0 或 k=q， 则 称 模式 下 是 不 可 重 登 的 。 试 撒 述 与 不 可 重 稚 模 式 相 应 的 
中 匹配 自动 宙 的 状态 转换 图 ， 

34.3-4* 已 知 两 个 模式 了 和 下 ″， 试 描述 如 何 构 造 一 个 有 限 自动 机 ， 使 之 能 确定 其 中 任意 一 个 模式 
的 所 有 出 现 位 半 。 要 求 护 量 使 自动 机 的 状态 数 最 小 ， 

34.3-5 已 知 一 个 包括 癌 乞 字符 〈 春 见 练习 34.1-5) 的 某 模 式 P， 说 明 如 何 构造 一 个 有 限 自 动机 ， 合 
其 在 On) 的 时 间 内 找 出 了 在 正文 工 中 的 一 诬 出 现 位 置 ，a= 人 1- 


34.4-1 汉字 母 表 为 工 = {a， 妇 时 ， 计 算 相 应 于 模式 ababbabbababbababbabb 的 前 绷 函 歼 。 

34.4-2 给 出 关于 9 的 函数 于 " 四] 的 规模 的 上 界 。 举 例 说 明 所 给 出 的 上 界 是 严格 的 。 

34.4-3 试 说 明 如 柯 通过 检查 串 PT 的 r 函 煞 来 确定 模式 ?在 正文 T 中 的 出 现 位 置 ( 冲 了 是 由 PP 和 
并 置 形 成 的 长 诬 为 imta 的 申 )， 

34.4-4 试 说 明 如 何 通过 以 下 方式 对 过 程 多 MP-MATCHER 进行 改进 : 把 第 了 行 【不 是 第 12 行 中 ) 
出 现 的 下 替 搞 为 g” ， 对 g= 1，2，…， 呈 的 诅 归 定 交 如 下 : 


如 果 r[ql] = 0 
人 9] 一 | zaa 如 果 rfq] 关 0 并 且 Pfzx[ql 十 切 =Pq 二 1 
FIq] 如 果 xf[q] 关 0 并 且 P[r[ql] 十 1 关 PIq 十 


试 解释 修改 后 的 算法 正确 的 原因, 并 说 明 在 何 种 意义 来 说 这 一 修改 是 对 原 算 法 的 改进 。 

34.4-5 写 出 一 个 线性 时 间 的 算法 以 确定 正文 T 是 和 否 是 由 另 一 个 串 工 ” 循环 旋转 而 产生 的 。 例 如 ，arc 
和 car 稚 此 间 均 可 由 对 方 手 环 旋转 而 产生 。 

34.4-6* ”给 出 一 有 效 算 法 以 计算 出 相应 于 某 给 定 模式 P 的 串 匹 配 自动 机 的 变迁 画 数 5。 所 给 出 的 算 
法 的 运行 时 间 应 该 是 Otm|Z)。( 握 示 : 证 肯 恕 果 q=m 或 PEq+1]sa， 则 8q，a) =5zfqlj，a) ) 


34.5-1 对 十 模式 P=0101101201 和 字母 玫 互 = 划 ，1， 站 计算 出 相应 的 和》 画 数 。 

34.5-2 举例 说 明 通 过 把 坏 字 符 和 启发 性 方法 局 发 性 方法 结合 起 来 使 用 ， 可 以 鲁 Boyer-Meoore 
算法 的 运行 性 能 比 仅 使 用 好 后 缀 启发 性 方法 时 要 优越 得 多 。 

34.5-3*+ ”我 们 在 实际 诺 用 中 常 对 基本 的 Boyer-Meore 过 程 进行 如 下 改进 : 用 ? ”来 替换 ? 函数 ，? 
函数 的 定 沁 汶 : 

} ”中 = 一 maxtk :站 刀 KK<m 且 PU+l1.mo 一 也 且 
(一 mi>0 昔 售 PHUFERC 一 mmH]) |。 

除了 保证 好 后 组 中 的 字符 在 新 的 位 移 处 不 会 号 要， “7 函数 同时 保证 同一 一 个 模式 字符 不 会 与 坏 正 文字 符 

进行 号 配 。 试 说 明 如 何 有 效 地 计算 出 7” 函数 ， 
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第 三 十 五 章 ”计算 几何 学 


计算 几何 学 是 计算 机 科学 的 一 个 分 支 , 研究 解决 几何 问题 的 等 法 。 在 现代 工程 与 数学 
中 ， 计 算 机 图 形 学 、 机 器 人 学 、VLSI 设计 、 计 算 机 辅助 设计 以 及 统计 学 等 领域 都 要 应 用 计 
算 几 何 学 。 计 算 几 何 学 问题 的 输 和 一般 是 关于 一 组 几何 物体 的 描述 ， 如 一 组 点 、 一 组 线段 ， 
或 者 一 个 多 边 形 按 逆 时 针 方向 排列 的 顶点 。 输 出 常常 是 有 关 这 些 物 体 的 问题 的 回答 ， 如 是 否 
有 直线 相交 ， 是 否 可 能 产生 一 个 新 的 几何 物体 ， 如 顶点 集合 的 凸 包 (包含 这 些 硕 点 的 最 小 凸 
多 边 形 )， 

在 本 章 中 ， 我 们 将 学 习 一 些 二 维 的 〈 即 平面 上 的 ) 计算 几何 学 问题 。 每 个 输入 物体 都 用 
一 个 点 的 集合 {pj} 表 示 ， 其 中 每 个 = (5，y) ,和 0，iER。 例 如 ， 一 个 个 顶点 的 多 边 形 
P 用 按照 在 P 的 边界 上 出 现 的 顺序 排列 的 顶点 序列 < po，pl，pP:，…，Pp _ > 表示 。 计 算 几 
何 学 也 可 以 在 三 维 室 间 ， 甚 至 也 可 以 在 高 维 空间 中 进行 求解 ， 但 要 使 这 样 的 问题 与 其 解 形 像 
化 是 很 困难 的 。 但 是 ， 即 使 在 二 维 平 面 上 ， 我 们 也 能 够 看 到 计算 几何 学 技术 的 一 些 例子 。 

35.1 节 主 要 说 明 如 何 有 效 而 精确 地 回答 有 关 线 段 的 一 些 简 单 问题 : 一 条 线段 是 在 与 其 
公共 一 个 端点 的 另 一 条 线段 的 顺 时 针 方 向 还 是 在 道 时 针 方向 ? 当 通 过 两 条 相 邻 线段 时 我 们 转 
沿 娜 个 方向 ?两 条 线段 是 否 相 交 ? 35.2 节 介 绍 了 一 种 称 为 “ 扫 中 "的 技术 ， 我 们 运用 这 种 技 
术 可 以 开发 出 一 种 运行 时 间 为 On JE n) 的 算法 , 以 确定 n 条 线 侦 中 是 否 包 含 相交 线段 。 
35.3 节 中 提出 了 两 种 “旋转 扫除 "的 等 法 以 计算 出 n 个 点 的 凸 包 (包含 这 些 点 的 最 小 凸 多 边 
形 ): 运行 时 间 为 On lg nj 的 Graham 招 摘 法 和 运行 时 间 为 Onh) 的 Javis 步 进 法 (h 是 
凸 包 的 顶点 数 )。 最 后 ，35.4 节 介 绍 了 一 种 运行 时 间 为 Danlgn) 的 分 沧 算 法 , 该 算法 用 于 找 
出 在 平面 上 nm 个 点 中 上 路 离 最 近 的 点 对 ， 


35.1 ”线段 的 性 质 


在 本 章 中 有 好 几 个 计算 几何 学 算法 都 要 涉及 到 线段 的 性 质 。 两 个 不 同 的 点 pi= (xy 
yi) 和 pz=(x，y2) 的 凸 组 合 是 任意 满足 下 列 条 件 的 点 pi;=(x3，7): 对 某 个 0 过 xs 和 1， 有 ， 
区 3 一 0XIT(1 一 xx) x2， 轨 一 xyi+(1I-aj 7。 我 们 也 写作 pi= opi+(1-o pa。 在 直观 上 看 ，Pp, 是 
通过 p, 和 p: 的 直线 上 并 处 于 pi 和 ps 之 间 〈 也 包括 Pl 和 py 两 点 ) 的 任意 点 。 如 果 已 知 两 
个 相 异 点 p; 和 pz， 则 线段 p,p, 是 pl 和 ps 的 凸 组 合 的 集合 。 我 们 称 p, 和 p: 为 线段 PP 。 的 
端点 。 有 时 pi 和 p: 的 顺序 是 有 关系 的 ， 这 时 我 们 可 以 说 有 向 线 锋 ppP， P,。 如 果 pi 是 原点 
(0，0)， 我 们 可 以 把 有 向 线段 p,p, 看 作 向 量 pa。 

在 本 节 中 ， 我 们 将 探讨 下 列 问题 : 

1. 已 知 两 条 有 向 线段 p,p, 和 pp,， 对 它们 的 公共 端点 pe 来 说 ， pup, 是 否 在 p,p, 的 顺 
时 针 方向 上 ? 
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2. 已 知 商 条 线段 pp， 和 Pp,p, ， 如 果 我 们 先 通过 p,p。 再 通过 p,p, ， 在 点 p 处 是 不 是 要 
向 左 转 ? 

3. 线 段 pp。 和 p,p,; 是 否 相 交 ? 

对 已 知 点 p, 和 ps 没有 任何 限制 。 

我 们 可 以 在 O(1) 的 时 间 内 回答 每 个 问题 ， 这 并 不 会 使 人 惊讶 因为 每 个 问题 的 输入 规模 
都 是 OLH) 。 此 外 ， 我 们 所 用 的 方法 仅 限于 加 法 、 减 法 、 乘 法 和 比较 运算 。 我 们 既 不 需要 除 
法 运算 也 不 需要 三 角 函 数 ， 使 用 这 两 种 运算 的 代价 都 比较 高 昂 并 且 易 于 产生 含 人 误差 问题 。 
例如 ， 确 定 两 条 线段 是 否 相 交 的 “简便 "方法 一 -对 每 条 线段 计算 出 形 如 y= mxt+b 的 直线 方 
程 (其 中 mm 为 斜率 ，b 为 y 轴 截 蝶 )。 找 出 直线 的 交点 并 检查 该 交点 是 否 同时 在 两 条 线段 上 
-一 运用 了 除法 以 求 出 交点 。 当 线段 几乎 平行 时 ， 该 算法 对 实际 计算 机 中 除法 运算 的 精确 度 
非常 敏感 。 而 本 节 中 没有 使 用 只 法 的 方法 却 要 精确 得 多 。 
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受 积 


叉 积 的 计算 是 关于 线段 算法 的 中 心 。 考察 如 图 35.1(aj 所 示 的 向 量 p 和 pv, 我 们 可 以 把 
各 积 PP 关 PP 看 作 由 点 (0， 避 ) ， 六 1， P 和 bj 十 Ba 一 (1 十 X2， YI 十 y2)} 所 形成 的 平行 四 边 形 的 阴 
影 面积 。 我 们 另外 给 出 又 积 的 等 价 而 更 有 用 的 定义 如 下 : 把 又 积 定义 为 一 个 矩阵 的 行列 式 : 


关 1 天 
p, xp; =de 
yY1 了 2 
一 2 一 
三 一 P, 关 卫 ， 
如 果 pl x p2 为 正 数 ， 则 相对 原点 〈0，0) 来 说 ，bi 在 p; 的 顺 时 针 方 向 ; 如 果 pi xp 
为 负数 ， 则 pi 在 PP 的 北 时 针 方 向 。 图 35.1(b) 示 婴 了 关于 向 量 p 的 顺 时 针 区 域 与 道 时针 区 
域 。 重 阴影 区 域 为 P 的 道 时 针 区 域 。 叉 积 为 0 是 边界 条 件 , 在 这 种 情况 下 ， 两 个 向 量 是 共 线 
的 ， 其 方向 可 以 相同 或 相反 。 
为 了 确定 对 公共 靖 点 pe， 有 向 线段 p,p, 是 否 在 有 向 线段 p,p, 的 顺 时 针 方向 ， 我 们 仅 需 
把 po 作为 原点 就 可 以 了 。 亦 即 , 我 们 设 pi-po 表示 向 量 pi = (xi，yD) ， 其 中 区 =x 一 xo， 
y=y-yo， 我 们 可 以 再 类 似 地 定 光 py-pbo 然后 计算 又 积 : 








(pi 一 poj xp 和 一 po 一 亿 I 一 xo) (72 一 y0) -or (yi 一 yo) 
如 果 该 义 积 为 正 ， 则 有 By 在 pp 的 顺 时 针 方 向 上 ; 如 果 为 负 ， 册 
P,B 在 P,P, 的 道 时 针 方向 上 . 


确定 连续 线段 是 向 左 转 还 是 向 右 转 


我 们 讨论 的 下 面 一 个 问题 是 两 条 连续 线段 p,p， 和 pp. 在 点 p; 是 向 左 转 还 是 向 右 转 。 
等 价 地 ， 我 们 希望 找 出 一 种 方法 以 确定 一 个 给 定 的 角 popip: 的 转向 。 运 用 叉 积 使 我 们 无 需 
对 角 进行 计算 就 可 以 回答 这 个 问题 。 如 图 35.2 所 示 ， 我 们 仅仅 需要 检查 一 下 有 向 线段 pp 
是 在 有 向 线段 pupi 的 顺 时 针 方 向 还 是 道 时 针 方向 为 了 做 到 这 一 点 ， 我 们 计算 出 又 积 
(pz-pe) x (pi 一 po0)。 如 果 该 又 积 的 符号 为 负 ， 则 pP,p, 在 p,p, 的 逆 时 针 方向 ， 因 此 在 pi 点 我 
们 在 向 左 转 . 如 果 又 积 为 正 就 说 明 Pep; 在 Pup， 的 顺 时 针 方向 ， 因此 在 p; 点 我 们 在 向 右 转 。 
叉 积 为 0 说 明 占 pop 和 疡 共 线 。 


并 PP 





Counterclockwise clockwise ， 


有 0 向 
人 人) 
岁 3 Adawdve 确 定 连续 线段 p,p， 和 pp PP。 在 点 Pi; 处 的 转向 

确定 两 条 线段 是 吾 相 交 

我 们 分 两 步 来 确定 两 条 线段 是 否 相 交 。 第 一 步 为 快速 排斥 : 如 果 两 条 线段 的 界限 框 不 
相交 ， 则 线段 也 不 可 能 相交 。 一 个 开 何 图 形 的 界限 框 是 指 包 含 该 图 形 并 且 线 段 平行 于 x 轴 
和 y 轴 的 最 小 窍 形 。 线 段 p,p， 的 界限 框 用 答 形 ( 舍 , ，$,) 表示 ， 其 堪 下 角 点 为 6， 
二 ( 信 ,， 放 ) ， 右 上 角 点 为 刘 , = 仿 ,， 人 ) ， 其 中 六 = min 人 和) ， 今 
=min (y,，y:) ，, 一 max. (xi，X) ，9) 一 Imax (了 7,，y) 。 用 左下 角 点 和 右上 角 
点 全 ,， 人.) 和 ( 信 ,，f ) 表示 的 两 个 矩阵 相交 当 旦 仅 当 合 取 式 

饶 ; 其 ) 八代 六 交 放 八 舍 ,安放 ,) 人 售 减 乡 ) 

为 真 。 两 个 矩形 必须 在 两 个 方向 相交 。 上 式 中 前 面 两 个 比较 式 确 定 抢 阵 是 各 在 x 方 向 相 
交 ， 后 面 两 个 比较 式 确 定 第 阵 是 否 在 y 方向 相交 。 

在 诀 定 两 条 线段 是 否 相 交 的 第 二 步 是 确定 每 条 线段 是 否 " 跨 立 " 另 一 条 线段 所 在 的 直线 。 
如 果 扣 pl 处 于 一 条 直线 的 一 边 ， 而 点 pz 处 于 该 直线 的 另 一 边 ， 则 我 们 说 线段 p， P, 跨 立 该 直 
线 。 如 果 pi 或 ps 处 于 直线 上 ， 我 们 也 说 线段 跨 立 该 直线 。 两 条 线段 相交 当 且 仅 当 它们 能 够 
通过 快速 排斥 试验 , 并 且 每 一 条 线段 都 距 立 另 一 条 线段 所 在 的 直线 。 

我 们 可 以 运用 叉 积 方法 来 确定 线段 p,p, 是 否 跨 点 p; 和 p: 所 在 的 直线 。 其 设计 思想 〈 如 
图 35.3(a) 和 《b) 所 示 ) 就 是 确定 有 向 线段 pp， 和 PP 是否 在 p,p: 的 两 边 相 对 的 位 置 上 。 
如 果 是 这 样 ， 则 线段 跨 立 该 直线 。 回 顾 一 下 我 们 已 经 能 够 用 叉 积 来 确定 相对 位 置 ， 我 们 仅 需 
检查 叉 积 (pp3 一 PT)) xp: 一 pp 与 (Pp4 一 p) x (pz 一 D1) 的 符号 是 否 相同 。 

一 620 一 








如 果 任 何 一 个 叉 积 为 0， 则 边界 条 件 出 现 ， 在 这 种 情况 下 。 或 者 ps 或 者 ps 处 于 线段 
piP, 所 在 的 直线 上 。 因 为 这 两 条 线段 都 已 通过 快速 排斥 试验 ， 所 以 实际 上 ps 和 ps 两 点 中 必 
有 一 个 点 处 于 线段 PP tp 上。 图 35.3(c) 和 .(d) 分 别 说 明了 这 两 种 情况 。 两 条 线段 共 线 但 不 
相交 的 情况 ， 如 图 35.3(e) 所 示 ， 不 会 通过 快速 排斥 试验 。 最 后 一 种 边界 条 件 出 现 于 其 中 一 
条 或 两 条 线段 的 长 度 为 0 时 ， 即 线段 的 两 个 端点 重合 。 如 果 两 条 线段 的 长 度 都 是 0， 则 仅 利 
用 快速 排斥 试验 就 可 以 满足 要 求 。 如 果 仅 有 一 条 线段 ; 如 
P;p, 的 长 度 为 中， 则 段 相交 当 且 仅 当 叉 积 (pi-p)》 x 人 ?0 
Tc-Pixfm-pi<a 
(p -Pi)xtm -Pi < (0xtparh<0 ep 
有 
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图 35.3 确定 线段 FJp， 是 否 跨 立 线段 PE。 所 在 的 直线 
叉 积 的 其 他 上 应用 ， 


本 章 后 面 的 部 分 中 将 介绍 又 积 在 其 他 方面 的 应 用 - 在 35.3 节 中 , 我 们 将 运用 又 积 根据 对 
某 措 定 原点 的 极 角 大 小 来 对 一 组 na 个 点 进行 排序 。 正 如 练习 35.1-2 将 要 求 读 者 证 明 的 那样 
又 积 在 排序 过 程 中 可 用 于 执行 比较 操作 。 在 35.2 节 中 , 我 们 将 运用 红 - 黑 树 来 保持 一 组 不 相 、 
- 交 线 段 的 垂直 顺序 。 在 这 种 方法 中 , 我 们 不 显 式 地 设置 关键 值 , 并 且 把 红 - 黑 树 代码 中 每 次 关 
键 字 比 较 代 以 又 积 的 计算 过 程 , 以 便 确定 与 某 指定 竹 直 线 相交 的 两 条 线段 的 对 直 顺序 。 


35.2 确定 任意 一 一 对 线段 是 否 相交 


本 节 要 讨论 用 于 确定 一 -组 线 虹 中 任意 两 条 线 肛 是 否 相交 的 -种 算法 该 算法 使 用 了 一 一 种 
称 为 “扫除 "的 技术 ， 这 种 技术 在 许多 计算 几何 学 算法 都 采用 了 了。 此 外 , -本 节 末 必 的 练习 说 明 
了 这 一 算法 (或 其 简单 变 体 )， -还 可 用 于 解决 其 他 计算 几何 学 问题 。 
该 算法 的 运行 时 间 为 Dln 凶 ma) ，n 是 已 知 的 线段 数目 。 它 仅 确定 是 可 存在 相交 线段 ， 
但 不 打印 出 所 有 的 相交 点 。 {( 报 据 练习 35.2 一 1， 在 最 证 情况 下 要 找 出 个 线段 中 的 所 有 相交 
点 所 需 的 时 间 为 Qtn ).》 
在 扫除 中 ， 一 条 假想 的 重 直 扫除 线 穿 过 已 知 的 一 组 几何 物体 ， 并 且 通 常用 从 左 到 有 依次 
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移动 扫除 线 。 扫 除 线 移 动 的 空间 方向 (在 这 种 情况 下 为 x 轴 方 向 ) 可 以 看 作 时 间 上 先后 顺序 
的 度量 。 扫 除 技术 提供 了 一 种 对 几何 物体 进行 排序 的 方法 ， 通 常 我 们 先 把 它们 放 人 动态 数据 
结构 , 并 且 利 用 它 们 之 间 的 关系 对 其 进行 排序 本 节 中 确定 线 纂 相交 的 算法 按 从 左 向 右 的 次 
序 考察 所 有 的 线段 端点 ,每 次 过 到 一 个 端点 就 核查 是 否 有 相交 点 存在 。 

确定 mn 条 线段 中 任意 两 条 是 否 相交 的 算法 作出 了 如 下 两 条 使 问题 简化 的 假设 。 第 一 ， 
假定 没有 一 条 输 和 人 线 是 垂直 的 。 第 二 ， 假 定 没有 三 条 输入 线 医 相交 于 同一 个 点 。 (练习 
35.2-8 要 求 描述 一 种 即使 在 上 述 假设 不 成 立 的 情况 下 仍 能 正确 运行 的 算法 实现 .) 的 确 ， 如 
果 去 掉 上 面 两 条 使 问题 简化 的 假设 ， 对 边界 条 件 的 处 理 就 常常 是 我 们 在 设计 计算 几何 学 算法 
并 证 明 其 正确 性 中 最 款 手 的 部 分 


排序 线段 


因为 我 们 假定 不 存在 垂直 线段 ， 所 以 任何 与 给 定 垂 家 扫除 线 相交 的 输入 线 毁 与 其 只 能 有 
一 个 交点 。 因 此 我 们 可 以 根据 交点 的 y 坐标 对 与 一 给 定 垂 直 扫除 线 相交 的 线段 进行 排序 。 

更 准确 地 说 ， 考 察 两 条 不 相交 线段 和 s。 如 果 一 条 横 坐 标 为 x 的 垂直 扫除 线 与 这 两 
条 线段 都 相交 ， 则 说 这 两 条 线段 在 x 是 可 比 的 。 如 果 s) 和 中 在 是 可 比 的 ,并 且 si 与 在 x 
的 扫除 线 的 交点 比 s 与 同一 条 扫除 线 的 交点 高 ， 则 说 在 x 处 si 位 于 s 之 上 ， 写 作 si > s?。 
例如 ， 在 图 35.4(a) 中 ， 我 们 有 下 列 关 系 : a>p， a&> 出 ， b>te a>iC，b> ,cc。 线 段 d 与 
其 他 任何 线段 都 不 可 比 。 

对 任意 给 定 的 x， 美 系 *> "是 定义 在 与 位 于 x 的 扫除 线 相交 的 线段 上 的 全 序 关系 ( 参 
网 5.2 节 )。 但 是 ， 当 线段 进入 和 离开 该 排序 时 随 着 x 值 的 木 同 ， 线 段 的 次 序 也 可 以 不 同 。 
当 线 妇 的 左 端点 明 到 扫除 线 时 ， 线 段 就 进入 排序 。 当 其 右 端 点 遇 到 扫除 线 时 就 离开 排序 。 

当 扫 除 线 穿 过 两 条 线段 的 交点 时 会 发 生 什么 样 的 情况 ? 如 图 35.4(b) 所 示 ， 它 们 在 全 序 
中 的 位 置 被 闫 倒 了 。 扫 除 线 v 和 w 分 别 位 于 线 航 e 和 了 的 交点 的 左边 和 右边 ， 并 且 我 们 有 
e> ff> ,e。 注 意 ， 因 为 我 们 假定 没有 三 条 线 侦 相交 于 同一 点 ， 所 以 必 有 某 条 垂直 扫除 线 
x 满足 相交 线段 e 和 上 在 全 序 > , 中 是 连续 的 。 任何 穿 过 图 35.4Cb) 中 阴影 区 域 的 扫除 线 ， 如 
z， 都 使 和 Tf 在 其 全 序 中 连续 。 





{a] 的 (bb 
图 35.4 根据 各 种 垂直 扫除 线 确 定 线段 的 顺 上 


扫除 线 的 移动 


由 而 的 扫除 算法 要 操 级 下 列 两 个 数据 集合 : 
1. 扫 除 线 状 态 给 出 了 与 扫除 线 相交 的 物体 之 间 司 的 关系 。 
2. 事 位 点 调度 是 一 个 从 左 癌 右 排 列 的 x 坐标 的 序列 ， 它 定义 了 扫除 线 的 暂停 位 置 。 我 们 
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称 每 个 这 样 的 暂停 位 置 为 一 个 事件 点 。 扫 路 线 状 态 仅 在 事件 点 才 会 发 生变 化 。- 
对 于 某 些 算法 〈 例 如 练习 35.2-? 所 要 求 的 算法 )， 事件 点 调度 是 随 算法 执行 而 动态 地 确 
定 的 。 我 们 现在 讨论 的 算法 仪 是 基于 输 人 数据 的 简单 性 质 静态 地 确定 事件 点 。 特定 地 ,每 条 
线段 的 端点 都 是 事件 点 .我们 通过 增加 x 坐标 并 从 堪 向 右 执 行 来 对 线段 的 端点 进行 排序 ， 当 
通 到 线段 的 左 端 点 时 , 就 把 该 线 眉 播 人 到 反 除 线 状 态 中 ， 并 且 当 届 到 其 右 端点 时 就 把 它 从 扫 
除 线 状态 中 删 去 。 每 当 两 条 线段 在 全 序 中 第 一 次 变 为 连续 时 ， 我 们 就 核查 它们 是 否 相 交 。 
扫除 线 状 态 是 一 个 全 序 TY， 对 此 我 们 要 求 下 列 操作 : 四 
INSERT(T，9): 把 线 朗 $ 播 入 到 工 中 。 
. DELETE(T，S):， 把 线 眉 S 从 至 中 删除 。 
- ABOVE(T，S): 返 贺 T 中 紧 靠 线段 S. 上 面 的 线段 。 
.BELOW(T，S): 返回 工 中 紧 靠 线段 S 下 面 的 线 设 ， 
如 果 输 入 中 有 上 条 线段 ， 则 运用 红 -- 黑 树 就 可 以 在 Clg n) 的 时 间 内 执行 5 上 述 每 个 
作 。 读 者 可 以 回顾 一 下 , 我 们 在 第 十 四 章 所 介绍 的 红 - 黑 树 操作 涉及 了 关键 字 的 比较 ， 我 们 
可 以 用 尺 积 比较 来 取代 关键 字 比较 以 确定 两 条 线 委 的 相对 站 序 ( 宛 练 习 35.2-2) 。 


求 线段 变 点 的 以 代码 


下 列 算法 的 输入 是 由 条 钱 段 组 成 的 集合 S， 如 果 S 市 的 任何 一 对 线 县 相交， 算法 就 返 
同 布尔 值 TRUE， 否 则 返回 布尔 值 FALSE， 全 放 了 是 由 一 操 红 - “村 裙 来 实现 的 ， 


ANV-SEGMBNTS-INTERSECT(S) 
1 了 = 全 
2 对 集合 s 中 线段 的 端点 从 左 向 右 进 行 排序 ， 
对 x 坐标 相同 的 端点 ， 把 y 坐标 较 小 的 点 放 在 前 面 。 
3 _ for 在 端点 的 排 庆 表 中 的 每 一 个 点 P 
站 do 这 5 是 线 朋 ss 的 左 端点 . 
5 then INSE 衣 工人， 扩 
6 (BOVET， 存 在 并 与 5 相交) 
-or(BELOW(T. 习 存 在 并 与 g 相交 ) 


| 


then return TRUE 
8 证 、 5 是 线段 s 的 右 端点 


9 ，then 诺 AROVE(CT，s) 和 BEuGwer， s} 者 存在: ， - 
并 且 ABOVEKEF， 时 y 与 芭 ELOWIT， 身 相交 
tn0 -也 提 return TRUEE 本 


11 卫 ELETELT， 
1]2 ITeturn FALSE 


图 35.5 说 明了 算法 和 执行 过 程 ， 第 1 行 审 始 化 全 序 为 第 2 行 通过 对 2n 个 急 和 内 点 
从 左 向 右 进行 排序 ， 对 x 坐标 相同 的 端点 把 y 坐标 较 小 的 点 故 在 前 面 ， 最 后 确定 事件 点 调 
度 、 注 意 ， 我 们 可 以 通过 在 (xz， 妨 上 对 端点 按 词 典 顺 序 进 行 排序 米 热 行 第 2 行 的 操作 。 

第 3-11 行 的 for 循环 中 的 每 次 欠 代 均 对 一 个 事件 点 世 进 行 处 理 。 如 果 甩 是 线段 s 的 左 ， 
端点 ， 则 第 5 行 把 s 加 到 全 序 中 , 如 果 s 与 在 由 经 过 的 扫除 线 定 义 的 全 序 中 与 其 连续 的 两 
条 线段 中 的 任何 一 条 相交 ， 则 第 6-7 行 返 回 TRUE。 (如 果 p 位 于 另 一 条 线段 "上 ， 则 出 现 
边界 情形 。 在 这 种 情况 下 ， 我 们 仅 楼 求 s 和 s' 被 连续 地 放 人 工 中 .) 如 果 p 是 线 毁 s 的 右 端 
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点 。 则 把 s 从 全 序 中 删除 。 在 由 穿 过 p 的 扫除 线 所 定义 的 全 序 中 , 如 果 s 旁边 的 两 条 线段 间 
有 交点 则 第 %-10 行 返回 TRUE; 当 s 被 删除 后 ， 这 些 线段 在 全 序 中 就 变 为 连续 。 如 果 这 些 
线段 不 相交 ， 则 第 11 行 把 线段 s 从 全 序 中 删除 。 最 后 ， 如 果 在 处 理 完全 部 2n 个 事件 点 后 没 
有 发 现 线段 相交 ， 第 12 行 返回 FALSE。 





图 35.5 ANY-SEGMENTS-INTERSECT 的 执行 过 程 


正确 性 


下 列 定理 说 明了 过 程 ANY-SEGMENTS-INTERSECT 是 正确 的 .。 

定理 35.1 ”对 过 程 ANY-SEGMENTS INTERSECT(S) 的 调用 返回 TRUE 当 且 仅 当 
S$ 中 的 线段 之 间 有 一 个 交点 . 

证 明 : 人 奴 当 不 存在 相交 点 时 过 程 返回 TRUE、 或 至 少 存 在 一 个 相交 点 时 过 程 返 回 
FALSE 时 过 程 产生 错误 。 前 一 种 情况 不 可 能 出 现 ， 因 为 过 程 ANY-SEGMENTS-IN- 
TERSECT 仅 当 找到 两 个 输入 线段 间 的 交点 时 才 可 能 返回 TRUE。 

为 了 证 明 后 一 种 情况 也 不 可 能 出 更， 我们 假定 为 了 引 和 人 矛盾， 设 至 少 存在 一 个 交点 时 ， 
ANY-SEGMENTS-INTERSECT 返回 FALSE。 设 p 是 最 左边 的 交点 ， 若 还 有 x 坐标 相 
同 的 最 左 相 交点 ， 则 选取 具有 最 小 y 坐标 的 点 p。 设 a 和 hb 是 相交 于 p 的 线段 。 因 为 在 p 的 
左边 不 存在 相交 点 ， 所 以 工 给 志 的 顺序 对 p 左边 的 所 有 点 都 正确 。 因 为 没有 三 条 线段 相交 
于 同一 点 ， 所 以 存在 一 条 扫除 线 z， 使 得 在 za 和 b 在 全 序 中 变 为 连续 。 如 果 我 们 允许 三 
条 线段 相交 于 同一 点 ， 就 有 可 能 存在 一 线段 与 a，b 这 两 条 线段 均 相 交 于 p， 即 对 所 有 满 
a<wb 的 pp 左边 的 所 有 扫除 线 w， 我 们 有 a<wc 并 且 c<vb。 此 外 ，z 位 于 pb 的 左边 或 经 过 
p。 在 扫除 钱 z 上 存在 一 个 线段 端点 g 满足 它 是 a 和 在 全 序 中 成 为 连续 的 事件 点 。 如 果 
位 于 扫除 线 z 上 ， 则 q=P。 如 果 p 不 在 扫除 线 z 上 ,， 则 q 在 p 的 左边 - 在 任何 一 种 情况 
下 ， 仅 在 g 帘 处 理 前 ， 由 工 给 出 的 次 序 是 正确 的 。{ 这 里 我 们 依赖 于 p 是 y 坐标 最 小 的 最 去 
边 的 相交 点 。 因 为 我 们 是 按 词 典 顺序 对 事件 点 逐个 进行 处 理 ， 基 以 即使 p 在 扫除 线 z 上 并 存 
在 另 一 个 相交 点 也 在 z 上 ， 我 们 也 先 处 理 完事 件 点 q=p 后 另外 一 -个 交点 p* 才 能 对 全 序 工 
发 生 影响 。) 在 事件 点 qd 只 存在 两 种 可 能 的 操作 : 

1.a 或 b 被 插入 T， 而 另 一 条 线段 在 全 序 中 紧 舍 其 上 或 紧 竺 其 下 。 第 4 -7 行 检测 了 这 种 
情形 。 
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2. 线 段 a 和 b 已 在 工 中 ， 在 样 就 全 但 a 和 b 在 全 序 中 变 为 连续 。 第 8-11 行 检查 了 这 
种 情形 。 
丰 论 在 哪 一 种 情况 下 ， 都 会 找 出 交点 p， 从 而 了 假说 过 程 攻 同 FALSE 相 矛 盾 。 


运行 时 间 


如 果 集 合 3 中 有 mn 条 线段 ， 则 ANY-SEGMENTS-INTERSECT 的 运行 时 间 为 On Jg 
n)。 第 1 行 的 运行 需要 O(UD 的 时 间 。 如 果 使 用 合并 排序 或 堆 排序 ， 则 执行 第 2 行 所 需 的 时 
间 为 On lg mn。 由 于 总 共有 2n 个 事件 点 ， 所 以 第 3-11 行 的 for 循 斌 至 多 选 代 2n 次 。 每 次 
选 代 所 需 的 时 间 为 DO( lg 扑 ， 这 是 因为 每 个 红 -- 黑 树 操作 所 需 时 间 为 OUlgn )， 运 用 35.1 节 
中 的 方法 则 可 使 每 次 相交 测试 所 需 的 时 间 为 O()。 因 此 ， 整 个 运行 时 间 为 On lg m) 


3S.3 ”寻找 凸 包 


点 集 Q 的 凸 包 是 一 个 最 小 的 凸 多 边 形 P， 且 满足 Q 中 的 每 个 点 或 者 在 P 的 边界 上 ， 或 
者 在 P 的 内 部 。 我 们 用 CH(Q) 表示 Q 的 凸 包 。 形 像 一 点 地 说 ， 我 们 可 以 把 Q 中 的 每 个 点 ， 
看 作 露 在 -一 块 板 外 的 铁 钉 ， 那么 凸 包 就 是 包含 所 有 铁 钉 的 一 条 拉 紧 的 橡皮 绳 所 构成 的 形状 
图 35.6 说 明子 -- 组 点 及 其 凸 包 。 


已， 


Pa 
加 35S.6 点 集 虽 ， 上 其 色 部 分 为 其 凸 包 CHIOQ) 


在 本 节 中 我 们 将 介绍 两 种 算法 , 用 来 计算 由 个 点 组 成 的 集合 的 凸 包 。 两 种 算法 都 按 递 
时 针 方 向 输出 凸 包 的 项 点。 第 一 种 算法 称 为 Graham 扫描 法 ， 运 行 时 间 为 Qia tgn)。 第 二 
种 算法 称 为 Jarvis 步 进 法 ， 其 运行 时 间 为 Dlnh)，h 为 凸 包 的 顶点 数 。 从 图 35.6 中 可 以 君 
出 ，CH(Q) 的 每 一 个 顶点 都 是 QQ 中 的 点 。 两 种 算法 都 使 用 了 这 条 性 质 来 次 定 保留 QQ 中 的 
哪些 总 作为 凸 包 购 顶点 和 和 去掉 O 中 的 哪些 点 。 

事实 上 ， 有 好 几 种 方法 都 能 在 On ]g nj 的 时 间 计算 出 凸 包 。Graham 扫 摘 法 和 Jatvis 
步 进 法 都 运用 了 一 种 称 为 * 诈 转 扫除 "的 技术 ， 它 根据 每 个 顶点 对 一 个 参照 顶点 的 极 角 的 大 小 
来 依次 对 每 个 顶 癌 进行 处 理 。 其 他 方法 中 包 插 下列 几 种 方法 : 

- 在 增 量 方法 中 ， 对 点 从 左 到 右 进行 排序 后 得 到 一 个 序列 二 pl，p，…，pu> ， 在 第 i 
步 ， 根 所 从 左 开 始 的 第 个 点 对 三 1 个 最 左边 的 点 的 凸 包 CHCPI，pz，…，DP 六 。 
35.3-6 将 要 求 读者 证 明 实 现 这 种 方法 所 需 的 全 部 时 间 为 DOn lgm). 
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- 在 分 治 方法 中 ， 在 @tn) 的 时 间 内 ， mn 个 点 组 成 的 集合 役 分 划 为 两 个 子 集 ， 分 别 包 含 
最 左边 的 fny 2 ] 个 点 和 最 右边 的 [ ny/ 2 个 点 ， 并 对 子 梨 的 册 包 进行 递归 计算 ， 然后 用 一 
种 巧妙 的 办 法 在 On) 的 时 间 肉 对 计算 出 的 凸 包 进行 组合 。 

- 前 枝 - 搜 索 方 法 类 似 于 10.3 节 中 讨 话 的 最 坏 情况 下 线性 时 间 的 册 信 算法 。 它 通过 仅 和 
弃 剩 下 的 点 中 的 常数 部 分 的 点 来 寻找 凸 包 的 上 部 (或 "上 链 ”) 直至 仅 剩 下 凸 包 的 上 链 . 然后 
再 执行 同样 操作 找 出 下 链 、 从 渐 近 意义 上 来 看 ， 这 种 方法 速度 最 快 ， 抽 昌 后 包 和 包含 h 个 顶 
点 ， 则 该 方法 的 运行 时 间 仅 为 On ]g 3)。 

计算 一 组 点 的 凸 包 本 身 就 是 一 个 有 趣 的 问题 。 其 他 一 些 关 于 计算 几何 学 问题 的 算法 都 始 

于 对 凸 包 的 计算 。 例 如 ， 考 虑 二 维 的 最 远 对 问题 : 已 知 平面 上 一 组 na 小 点 并 希望 找 出 彼此 
闻 距 离 最 远 的 两 个 点 ， 练 习 35.3 一 3 将 要 求 读 者 证 明 这 两 个 点 必定 是 凸 包 的 顶点 。 尽 管 在 此 
不 作证 明 ， 但 我 们 知道 要 找 出 mn 个 项 点 的 凸 多 边 形 中 最 远 顶 点 对 需要 'On) 的 时 间 。 因 此 ， 
通过 在 On lg n) 的 时 间 内 计算 出 n 个 输入 点 的 凸 包 , 然后 再 找 出 得 到 的 凸 多 边 形 中 的 最 远 
顶点 对 , 我 们 就 可 以 在 D(n lg nj 的 时 间 内 找 出 任意 nm 人 


Graham 扫描 法 


Graham 扫描 法 通过 设置 一 个 关于 候选 点 的 堆栈 8 来 解决 凸 包 阿 题 . 输入 集合 忌 中 的 
每 个 点 都 被 压 人 堆栈 一 次 ， 非 CH(Q) 中 顶点 的 点 最 终 将 被 弹出 堆栈 。 当 算法 终止 时 ， 堆 栈 
S 中 仅 包含 CH(Q) 中 的 项 点 ， 其 顺序 为 各 点 在 边界 上 出 现 的 递 时 针 方 向 排列 的 顺序 。 

过 程 GRAHAM-SCAN 的 输 人 为 点 集 Q，1lQlz>3。 它 调用 函数 TOP(S) 返回 处 于 堆栈 
S 顶部 的 点 ， 并 调用 站 数 NEXT-TO-TOP(S) 返回 处 于 堆栈 顶部 下 面 的 那个 点 。 我 们 稍 会 
将 证 明 : 过 程 GRAHAM-SCAN 返回 的 堆栈 S 从 底部 到 顶 吕 依 次 是 投 赣 时 针 方向 排列 的 
CHLQ) 中 的 项 点 。 


侣 RAHAN-SCNANLIO) 
1 设 m 是 中 中 yy 坐标 最 小 的 点 ， 如 果 有 数 个 这 样 的 点 则 取 最 堪 边 的 点 作为 po。 
2 设 <pl，pb，…，bw> 是 如 中 剩 杂 的 点 ， 
并 对 其 控 道 时 针 方 向 相对 pw 的 极 角 进行 排序 . 
《如 果 有 数 个 点 有 相同 的 极 角 ， 则 去 掉 其 余 的 点 ， 只 留 下 与 Po 上 距 高 最 远 的 那个 点 .) 
topnfS]- 站 
PUSHLCp， 驴 } 
PUSH 人 OP，S) 
PUSHIP，S) 
toT ia-3 to mm 
do while 由 点 NEXT~TO-TOP(S) TOP(S) 和 启 所 形成 的 角形 成 一 次 非 诺 转 
do POP(S) 
PUSHILS， P 
return 乌 


or 


下 


35.7 说 明了 GRAHAM-SCAN 的 执行 过 程 。 第 1 行 选 取 po 作为 y 坐标 最 小 的 点 ， 
如 果 有 数 个 这 样 的 点 ， 则 选取 最 左边 的 点 作为 pe。 由 于 Q 中 没有 其 他 点 比 pe 更 低 ， 并 且 和 与 
其 有 相同 y 坐标 的 点 都 在 它 的 右边 ， 所 以 pe 是 CHCQ) 的 一 个 顶点 。 第 2 行 根据 Q 中 和 剥 余 
的 点 相对 于 pe 的 极 角 对 它们 进行 排序 ， 所 用 的 方法 ( 比较 及 积 ) 与 练习 35.1-2 中 相同 。 如 
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果 两 个 或 更 多 的 点 相对 po 的 极 角 相 同 ， 那 么 除了 与 po 距离 最 远 的 点 以 外 ， 其 余 各 点 都 是 pe 
与 该 最 远 点 的 凸 组 合 ， 因 此 我 们 可 以 完全 不 考虑 这 些 点 。 设 上 m 表示 除 pe 外 剩余 的 点 的 数 
_ 和 目 。Q 中 每 个 点 关于 pe 的 极 角 〈 用 弧度 表示 ) 属于 半 开 区 间 [0，ry 2) 中 。 由 于 极 和 角 按 逆 
时 针 方 向 增加 ， 所 以 我 们 可 以 把 这 些 点 按 相 对 po 的 六 时 针 方 向 进行 排序 。 我 们 指定 这 一 由 
点 组 成 的 排 岸 序列 为 <pi，P2，…， 耳 >。 注意 ， 点 pl 和 pv 都 是 CHI(Q) 中 的 顶点 〔〈 和 参见 


练习 3S.3 一 1) 。 图 35.7(a) 说 时 了 图 33.6 中 的 点 按 相对 于 po 的 极 角 进行 排序 得 到 的 序列 
过 Di， pz， ”…，l? 之 。 





图 35.7 GRAHAM-SCAN 在 图 35.6 所 示 的 集合 Q 上 的 执行 过 程 
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图 357 GRAHNAM_SCAN 在 图 356 所 示 的 集合 Q 上 的 执行 过 程 ( 续 ) 


过 程 中 的 剩余 部 分 运用 了 堆栈 S。 第 3--6 行 对 堆栈 进行 初始 化 , 使 其 从 底 到 项 依然 包 合 
前 面 三 个 点 po、Pl 和 Pb?。 图 35.7(a) 说 明了 初始 的 礁 栈 $S。 第 ?一 10 行 的 for 循环 对 序列 
<pu pw …,pa> 中 的 每 个 点 进行 一 次 选 代 。 算 法 的 意图 是 在 对 点 m 进行 处 理 后 ， 栈 $ 由 底 
到 项 依次 是 按 递 时 针 方向 排列 的 CH({p,，pi，…，pj 中 的 顶点 。 第 8-9 行 的 while 循环 
把 发 现 不 是 凸 包 中 的 顶点 的 点 从 堆栈 中 移 去 ， 我 们 沿 道 时 针 方 向 通过 凸 包 时 ， 在 每 个 项 点 应 
该 向 左 转 。 因 此 ，while 循环 每 次 发 现在 一 个 项 点 我 们 没有 疝 左 转 ， 就 把 该 顶点 从 堆 乒 中 弹 
出 。 我们 仅 是 检查 不 向 左 转 的 情况 ， 而 不 是 对 向 右 转 进行 检查 ， 这 样 的 测试 就 排除 了 在 所 
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形成 的 凸 包 的 某 个 项 点 处 为 直角 的 面 能 -这 正 是 我 们 所 着 望 的 。 因为 一 个 本 多 边 形 的 侮 个 项 
点 不 能 是 该 多 边 形 的 其 他 顶点 的 凸 组 合 .,) 当 算法 向 点 Di 推进 时 我 们 已 经 弹出 了 所 有 非 左 转 
的 顶点 后 ， 我 们 就 把 m 推 人 堆栈 中 。 图 35.7(b)-(k) 说 明了 for 循环 的 每 次 适 代 后 堆栈 8 的 
状态 。 最 后 , GRAHAM-SCAN 在 第 11 行 返回 堆栈 3$3。 图 35.7 人 显示 了 相应 的 凸 包 。 

下 列 定理 给 出 了 GRAHAM-SCAN 的 正确 性 的 形式 证 明 。 

定理 35.2(Graham 扫描 法 的 正确 性 ) 如 果 在 一 个 点 集 Q 上 运行 
GRAHAM-SCAN， 其 中 |Ql>3， 则 在 过 程 终 止 时 @Q 的 一 个 点 处 于 堆栈 S 中 当 且 仅 当 它 是 
CH(Q) 的 顶点 。 + 

证 明 : 如 上 所 述 ， 玫 是 pe 和 中 中 其 他 某 个 顶点 的 凸 组 合 的 顶点 都 不 是 CH(Q) 的 项 
上 点。 这 样 的 一 个 顶点 不 会 包含 在 序列 <pl，Pz，…，Ppm> 中 ， 因 此 也 不 可 能 出 现 于 堆栈 和 
中 。 

证 明 的 关键 在 于 图 3$.8 所 示 的 两 种 情形 。 

(a) 图 处 理 非 左 转 情形 ，{b) 图 处 理 左 转 情形 . 
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略 35.8 台 RAHAM-SCAN 的 正确 性 证 明 过 程 中 的 两 种 基本 情况 


我 们 先 证 明 从 奴 栈 $ 中 弹出 的 每 个 点 都 不 是 CH(Q) 中 的 顶点 。 假 设 点 pi 被 从 堆 杰 中 
弹出 是 因为 角 一 pxpipi 形成 非 堪 转 情 形 ， 如 图 35.8{a) 所 示 。 因 为 我 们 是 按 相 对 于 点 pu 的 极 
角 递 增 的 次 序 择 描 各 点 ， 所 以 存在 一 个 三 角形 人 pupip, 满足 pi 或 者 处 于 该 三 角形 的 内 部 ， 
或 者 处 于 线 自 .5 上 。 在 任何 一 种 情况 下 ， 点 证 都 不 可 能 是 CH(Q) 的 顶点 。 

现在 我 们 来 证 明 在 过 程 终止 时 堆栈 $ 中 的 每 个 点 都 是 CH(Q) 的 一 个 顶点 。 我 们 首先 证 
明 下 列 断 言 成 立 : GRAHAM~-SCAN 保持 下 列 条 件 不 变 ， 那 堆栈 S 中 的 点 总 是 形成 一 个 凸 
禾 边 形 的 按 道 时针 方向 排列 的 各 项 点 。 

第 6 行 执行 后 ， 该 断言 就 成 立 了 ， 这 是 因为 点 po，Ppi 和 p。 形成 一 个 凸 密 边 形 。 现 在 我 
们 来 考察 在 GRAHAM-~SCAN 的 执行 过 程 中 堆栈 $ 是 如 何 变化 的 。 各 个 点 或 者 被 压 人 堆 
栈 ， 或 者 被 弹出 堆栈 ， 在 前 一 种 情况 下 ， 我 们 依 末 于 一 条 简单 的 几何 性 质 : 如果 去 掉 凸 多 边 
形 的 一 个 顶点， 所 得 多 边 形 仍 是 凸 多 边 形 。 因 此 ， 从 堆栈 $ 中 弹出 一 个 顶点 依然 保持 上 述 

在 我 们 考虑 把 个 顶点 十 入 堆栈 的 情况 之 前 ， 让 我 们 考察 另外 一 条 几何 性 质 ， 如 
图 35.9 所 未 。(ta) 阴影 区 域 有 界 ，(b) 阴影 区 域 无 界 。 设 P 是 一 个 凸 多 边 形 ， 并 选取 卫 的 
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任意 一 条 边 PP_ 。 考 察 由 D， 和 两 条 相 邻 边 的 延长 线 所 围 成 的 区 域 (根据 与 5 P 相 邻 的 两 
条 边 所 成 的 贡 度 ， 该 区 域 既 可 能 是 有 界 的 ， 如 (a) 中 的 阴影 区 域 , 也 可 能 是 无 界 的 ,如 (b 
中 的 骨 影 区 域 ) 。 如 果 我 们 把 该 区 域 中 的 任何 点 p. 作为 一 个 新 顶点 加 人 P 中 ， 用 边 B 

和 pp， 取代 边 P_p ， 则 所 得 的 作 边 形 是 凸 多 边 形 。 


Pr 
0 户 二 
人 
所 A 
让 . 岂 
fa) fb) 


图 35.9 在 凸 才 按 形 P 的 阴影 区 域 加 人 一 个 点 就 得 到 另外 一 个 号 移 边 形 


现在 考察 被 压 人 堆栈 S 中 的 点 pl。 如 图 35.8(b) 所 示 ， 设 pi 是 在 压 人 hp 之 前 处 于 栈 8 
质 端 的 项 点 ，p' 是 栈 $ 中 p 的 前 驱 项 点 。 我 们 断言 mi 必定 落 在 图 35.8(b) 所 示 的 阴影 区 域 
内 ， 该 区 臧 直接 对 应 于 图 35.9 中 的 阴影 区 域 。 因 为 角 一 ppp; 是 向 左 转 ， 所 以 必定 在 
p,p, 的 延长 线 的 阴影 一 边 。 因 为 在 极 角 排 序 中 m 紧 随 Pi， 所 以 它 必定 在 pup; 的 阴影 一 边 。 
此 外 ， 根 据 我 们 选取 pu 的 方法 可 知 , 点 pi; 必定 在 p,p, 延长 线 的 阴影 一 边 。 因 此 ，Ppi 必定 处 
于 阴影 区 域 中 ， 因 而 在 pi 被 压 人 堆栈 $ 中 后 ，S 中 的 点 形成 -一 个 凸 多 边 形 。 这 样 我 们 就 证 
明了 上 于 述 断 言 成 这 ， 

因此 ， 在 GRAHAM-SCAN 结束 时 ， 堆 栈 S$ 中 的 和 的 所 有 点 形成 了 一 个 凸 多 边 形 的 
各 顶点 。 我 们 已 经 证 明了 不 在 S 中 的 点 都 不 是 CH(Q) 的 顶点 ， 或 者 等 价 地 ，CH(Q) 的 所 
有 顶点 都 在 堆栈 S 中 。 因 为 $ 仅 包 含 Q 中 的 顶点 , 且 这 些 点 形成 一 个 凸 多 按 形 ， 所 以 它们 必 
定形 成 CH(Q) 。 的 

琵 在 我 们 来 证 遇 GRAHAM--SCAN 的 运行 时 间 为 DOn lg na， 其 中 居 =IQlI。 执 行 第 1 
行 代码 怖 要 @(n) 的 时 间 。 如 果 运 用 合并 排序 或 堆 排序 来 对 极 角 进 行 排序 , 并 用 35.1 节 中 的 
又 积 方法 对 极 角 进行 比较 ， 那 么 执行 第 2 行 代码 所 需 的 时 间 为 On lg 由 。( 对 极 角 相 同 的 
点 。 除 最 远 点 以 外 的 其 他 点 都 被 去 掉 ， 完 成 这 一 操作 所 需 的 时 间 为 O(nm.) 第 3-6 行 执行 
时 间 为 OU)， 因 为 mm 和 on-1， 所 以 第 7-10 行 药 for 循环 至 多 执行 a-3 次 。 因 为 PUSH 的 执 
行 时 间 为 OU) ， 所 以 第 8-9 行 的 while 循环 中 的 每 次 壕 代 还 另外 需要 O(1) 的 时 间 。 除 了 
执行 嵌 套 while 循环 所 需 的 时 间 外 ， 整 个 for 循环 的 执行 时 间 为 D(n)。 

我 们 运用 平 摊 分 析 中 的 聚集 方法 来 证 明 执 行 整个 while 循环 所 需 的 时 间 为 DOtn) 。 对 
i=0，1，….m， 每 个 点 D 怡 好 被 压 人 堆栈 中 一 次 。 如 在 18.1 节 中 对 过 程 MULTIPOP 的 
分 析 那 样 ， 我 们 注意 到 对 每 个 PUSH 操作 对 多 存在 一 个 POP 操作 。 至 少 有 三 个 点 (po，P 
和 p ) 不 会 从 堆栈 中 弹出 ， 所 凡事 实 上 总 共 至 多 执行 m~2 次 POP 操作 。while 循环 中 每 次 
迭代 时 执行 - .次 POP 操作 ， 因 此 while 持 环 总 共 至 多 执行 m-2 次 送 代 。 由 于 第 8 行 的 测试 
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所 和 殖 时 间 为 OU1)， 每 次 调用 POP 所 怖 的 时 间 为 DI1)，、， 并 且 ms 和 na-1， 所 以 执行 while 循环 
所 需 的 全 部 时 间 为 DO(n)。 因 此 ， 过 程 GRAHAM-SCAN 的 运行 时 间 为 Dln lgm)。 


Jarvis 步 进 法 


Jarvis 步 进 法 运用 了 一 种 称 为 打包 的 技术 来 计算 一 个 点 集 Q 的 凸 包 。 算 法 的 运行 时 间 为 
Ooh)， 其 中 h 是 CH(Q) 的 顶点 数 。 当 h 为 O(lg n) 时 ，Jarvis 步 进 法 在 渐 近 意义 上 比 
Graham 扫 找 法 的 运行 速度 要 快 。 ， 

我 们 可 以 把 Jarvis 步 进 法 想像 成 在 集合 Q 外 紧 紧 地 包 了 一 层 纸 。 我 们 开始 时 把 纸 的 末 
端 粘 在 集合 中 最 低 的 点 上 ， 即 粘 在 与 Graham 扫描 法 开始 时 相同 的 点 py 上 。 该 点 为 凸 包 的 
一 个 项 点。 把 纸 拉 向 右边 使 其 贿 紧 ， 然 后 再 把 纸 拉 高 一 些 直至 磁 到 一 个 点 。 该 点 也 必定 是 上 
包 的 一 个 项 点。 使 纸 保持 绷 紧 状态 ， 用 这 种 方法 继续 围绕 顶点 集合 , 直至 回 到 原始 点 pu。 

更 形式 地 说 ，jJarvis 步 进 法 构造 了 CH(Q) 的 顶点 序列 也 = <po，P，…，ph_i>，po 为 
起 始点 。 如 图 35.10 所 示 ， 下 一 个 凸 包 顶 点 p 具有 相对 于 pu 的 最 小 极 角 。( 如 果 有 数 个 这 样 
的 点 ， 则 我 们 选取 臣 离 po 最 远 的 点 作为 pl.) 类 似 地 ，p, 具有 相对 于 pi 的 最 小 极 角 ， 等 
等 。 当 到 达 最 高 项 点， 如 pk (如 果 有 数 个 这 样 的 点 ， 则 我 们 选取 距离 最 远 的 顶点 .) 和 时， 我 
们 已 经 构造 好 CH(Q) 的 右 链 ， 如 图 35.10 所 示 。 为 了 构造 其 左 链 ， 我 们 从 P 开始 选取 相 
对 于 pt 具有 最 小 极 角 的 点 作为 pi， 但 这 时 的 x 轴 是 原 x 二 的 反方 向 。 如 此 继续 下 去 ， 根 
瀑 负 x 轴 的 极 角逐 渐 形成 左 链 , 直至 回 到 初始 顶点 pu 
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图 35.0 Jarvis 步 进 法 的 操作 


我 们 可 以 用 围绕 凸 包 的 一 次 概念 性 反 除 来 实现 Jarvis 步 进 法 ， 艺 无 需 分 别 构造 左 链 和 右 
链 。 在 这 样 一 种 典型 的 实现 方法 中 ， 要 随时 记录 上 次 选取 的 西 包 的 边 的 角度 , 并 要 求 凸 包 边 
的 角度 序列 严格 递增 〈 在 0 到 2r 弧度 范围 内 ) 分 别 构造 左右 旺 的 优点 是 无 需 显 式 地 计算 
角度 , 35.1 节 中 阐述 的 技术 就 是 对 角度 进行 比较 . 
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如 果 有 适当 的 实现 方法 ， 则 Jarvis 步 进 法 的 运行 时 间 为 Donh)。 对 CHIQ) 的 hh 个 顶点 . 
中 的 每 一 个 项 点 ， 我 们 找 出 具有 最 小 极 角 的 顶点 。 如 果 用 35.1 节 中 讨论 的 技术 ， 则 每 次 极 
角 比 较 操 作 所 需 时 间 为 (DJ 。 正 如 10.1 节 中 说 明 的 那样 ， 如 果 每 次 比较 操作 所 需 时 间 为 
Ot， 则 可 以 在 On) 的 机 间隔 计算 岂 n 个 值 中 的 最 小 值 。 因 此 ，Jarvis 步 进 法 的 运行 时 间 
为 Onh) 。 


35.4 寻找 最 近 点 对 


现在 我 们 考虑 在 nz>2 个 点 的 集合 Q 中 寻找 最 近 点 对 的 问题 .最 近 * 是 指 通常 的 欧 氏 虐 


离 : 点 pl= (xl.7D 和 pz= Co J 之 间 的 距离 为 : VC 一 zx 天 +G 一 y 六 。 集 合 Q 中 的 两 


个 点 可 能 重合 ， 在 这 种 情况 下 它们 之 间 的 距离 为 0。 例如， 这 一 问题 可 以 应 用 于 交通 控制 系 
统 中 ， 这 种 系统 需要 了 解 两 个 中 元 最 近 的 交通 工具 ， 以 便 检 测 出 可 能 产生 的 相模 事故 。 


最 简单 的 最 近 点 对 算法 查看 所 有 ( ] =Go) 个 点 对 ， 在 本 斑 中 ， 我 们 将 描述 _ 种 解 


快 该 问题 的 分 治 算法 ， 其 运行 时 间 可 用 我 们 区 大 的 递归 式 To) =2Tny72) +Otny 来 捕 
述 。 因 此 ， 该 算法 的 运行 时 间 仅 为 Onlgn)。 


分 治 算 法 


算法 的 每 次 递归 调用 的 输 人 为 子 集 PEQ 和 数组 式 和 阅 ， 每 个 数组 均 包 含 输 人 子 集 P 
的 所 有 点 。 对 数组 X 中 的 点 按 其 x 坐标 单调 递增 的 顺序 进行 排序 。 类 似 地 ， 对 数组 立 中 的 
点 按 其 y 坐标 单调 递增 的 顺序 进行 排序 。 注 意 ， 为 了 获得 DO legn)j 的 时 间 界 ， 不 能 在 每 次 
递归 调用 中 都 进行 排序 。 如 果 每 次 递归 调用 都 进行 排序 的 话 ， 运 行 时 间 的 递归 式 就 变 为 
Ton) =2Tm7 2 +OmnLgn， 其 解 为 To =Omlg“)。 我 们 稍 后 将 会 看 到 如 何 运用 * 预 
排序 "来 保持 这 种 排序 性 质 , 无 需 在 每 次 递归 调用 中 排序 。 

输入 为 P、X 和 Y 的 递归 调用 首先 检查 是 否 有 IP| 和 3， 如 果 是 改 样 则 仅仅 执行 上 述 的 


简单 方法 : 对 所 有 ( ) 对 点 进行 检查 ， 并 返回 最 近 点 对 . 恕 果 |PI> 3， 则 递归 调用 执行 如 下 分 


治 法 模式 : 

分 解 : 贼 册 条 生 直 编 1 把 点 人? 划 委 为 赃 必 下 到 条 件 的 网 个 集合 已 和 了 |P)| = 
JIAZ2 1，IPRl= 1 II 24，Pi 中 的 所 有 点 在 线 1 上 或 在 1 的 左 侧 ，Pn 中 的 所 有 
点 在 线 1 上 或 在 1 的 右 侧 。 数 组 和 被 划分 两 两 个 数组 XI 和 XR， 分 别 包含 P 和 
Pr 中 的 点 ， 并 按 工 坐标 单调 递增 的 次 序 进行 排序 。 类 似 地 ， 数 组 站 被 划分 为 丙 
个 数组 Yi 和 YY， 分 别 包含 P 和 P 中 的 点 ， 并 按 y 坐标 单调 递增 的 次 序 进行 
排序 。 

解决 :把 P 划 分 为 P, 和 P, 后 ， 再 进行 两 次 递归 调用 ， 一 个 找 出 P 中 的 最 近 点 对 ， 另 一 个 
找 出 P 中 的 最 近 点 对 。 第 一 个 调用 的 输入 为 子 集 P ， 数 组 Xi 和 Yi; 第 二 个 
调用 的 输 人 为 子 集 Pa，Xa 和 YR。 设 对 PL 和 Pn， 返回 的 最 近 点 对 的 距离 分 别 
为 和 列 ， 则 辕 5=minf5 ，5)。 
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合并 ， 最 近 点 对 要 么 是 某 次 递归 调用 找 出 的 距离 为 5 的 点 对 ， 要 人 么 是 P, 中 的 一 个 点 与 
PR 中 的 一 个 点 组 成 的 点 对 ， 算 法 确定 是 否 存在 其 距 咨 小 于 5 的 这 样 一 个 点 对 . 
注意 ， 如 果 存 在 虐 离 小 于 6 的 一 个 点 对 。 则 点 对 中 的 两 个 点 必定 都 在 距离 直线 1 


的 


5 单位 之 内 。 因 此 ， 如 转 35.11(a) 所 示 ， 它 们 必定 都 处 于 以 直线 1 为 中 心 、 


宽度 为 25 的 孝 直 带 形 区 域内 。 为 了 我 昌 这 笠 的 局 对 ( 洒 存 在 )， 算法 要 做 如 下 
工作 : 


1. 


它 建 立 一 个 数组 Y'， 它 是 把 数组 Y 中 所 有 不 在 寅 度 为 25 的 七 直 带 形 区 域内 的 
点 去 掉 后 所 得 的 煞 组 。 数 组 Y“ 与 一样 是 按 y 坐标 时 行 排序 的 。 

对 数组 Y* 中 的 每 个 点 p， 算 法 试图 找 出 Y“ 中 臣 离 p5 单 位 以 内 的 点 。 我 们 下 面 将 
会 看 到 、 在 YY 中 仅 需 考虑 紧 随 p .后 的 了 个 点 ， 算 法 计算 出 从 P 到 这 了 个 点 的 
矩 离 ， 并 记录 下 YY 中 所 有 点 对 中 找 出 的 最 近 点 对 的 虐 离 ? 


.如 果 只 <， 则 委 直 带 形 区 域内 的 确 包 含 比 我 们 根据 递归 调用 所 找 出 的 最 近 虐 


窗 更 近 的 点 对 ， 于 是 返回 该 点 对 及 其 距离 6 。 否则 就 返回 递归 调用 中 发 现 的 
最 近 点 对 及 其 距离 宁 。 


上 述 持 述 中 省 几 了 一 些 对 获得 Oon 妈 思 的 运行 时 间 非 常 必要 的 实现 细节 。 在 机 杀 


的 正确 性 以 后 ， 


加 时 
9 


正确 性 


我 们 糙 说 明 如 何 实现 算术 才能 获得 要 求 的 运行 时 间 范 围 。 


5 


三 
ee 
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图 35.11 证 明 最 近 结 点 对 算法 需要 检查 数组 立 ′ 中 每 个 点 后 面 的 7 个 点 


除 以 下 两 个 方面 外 ， 这 种 最 近 点 对 甜点 的 正确 性 是 显而易见 的 。 第 --， 当 |Pts3 时 道 归 


调用 过 程 到 底 ， 
中 其 随 每 个 点 
假定 在 其 一 


我 们 就 能 保证 不 会 对 仅 售 一 个 点 的 集合 进行 分 划 。 第 二 ， 仅 需 检查 数组 Y 
p 后 的 ?7 个 点 。 现 在 我 们 就 来 证 明 这 条 性 质 . 
级 递归 调用 中 ， 最 近 点 对 为 fr 入 了 1 ， bpRe Ps 因此 ， 。 和 p。 间 的 虐 离 严 


格 小 于 5。 点 pl 必定 在 直线 1 上， 或 在 1 左边 5 单位 以 内 。 类 似 地 ，B 必定 在 直线 1 上 ， 或 
在 1 右边 5 单位 以 内 。 此 外 ,bi 和 ps 的 垂直 距离 也 小 于 耳 单 位。 因此， 如 图 35.11(ajy 斯 
示 ，pt 和 py 在 以 直线 ! 为 中 心 线 的 5x 25 矩阵 区 域内 。 (在 该 矩阵 内 也 可 能 有 其 他 点 .) 

下 面 我 们 证 明了 中 至 多 有 8 个 点 可 能 处 于 该 5x 25 矩阵 区 域内 ， 考察 该 矩形 左 半 边 的 5 
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x6 正 方形 。 因 为 Pi 中 的 所 有 点 之 间 的 距离 至 少 为 8$ 单 位 ， 所 以 至 多 有 4 个 点 可 能 位 于 该 
正方 形 内 ， 图 35.ii(b) 说 明了 其 源 因 。 类 似 地 ，BPa 中 至 多 有 4 个 点 可 能 位 于 该 矩形 右 半 边 
的 5x5 正 方形 内 。 因 此 ，P 中 至 多 有 8 个 点 可 能 位 于 该 5x 26 矩形 肉 。 (注意 ， 由 于 直线 上 
的 点 可 能 属于 PL， 也 可 能 属于 Pk， 所 以 直线 | 上 最 密 可 以 有 4 个 点 。 如 果 有 两 对 重合 的 
上 点， 每 对 包含 一 个 P 中 的 点 和 和 一 个 Pa 中 的 点 ， 一 对 在 真 线 1 与 插 形 上 面 一 条 进 的 兖 点 处 ， 
另 一 对 在 直线 1 与 矩形 下 面 一 条 按 的 交点 处 ， 就 会 达到 和 上述 限制 .) 

在 说 明了 P 中 至 多 有 8& 个 点 可 能 位 于 该 矩形 中 后 ， 就 很 容易 看 出 仅 需 检查 数组 Y' 中 每 
个 点 之 后 的 7 个 点 。 我 们 仍 假 设 最 近 的 点 对 为 六 和 各 ,并 (不 失 一 般 性 ) 假 设立 中 p 位 于 Pr 
之 前 . 那么 ， 邯 使 pt 在 立 ' 中 尽 可 能 早出 现 而 pg 尽 可 能 上 晚 出 现 ，pv 也 定 跟 随 牟 :的 7 个 位 
置 中 的 一 个 。 因此， 我 们 就 证 明 了 隔 近 点 对 算法 是 正确 的 


算法 实现 与 运行 时 间 


正如 已 经 注意 到 的 那样 我 们 的 目标 是 取得 关于 运行 时 间 的 递归 式 TD) =2Tny2) 
+O(a)， 其 中 TUn)》 在 nm 个 点 的 集合 上 算法 的 运行 时 间 。 主 要 困难 在 于 保证 传递 给 递归 调用 
的 数组 Xi ，Xnx，YL 和 Ya 能 按 适 当 的 坐标 进行 排序 , 并 且 能 使 Y' 按 y 坐标 进行 排序 。( 注 
意 ， 如 果 递 归 调用 接收 的 数组 X 已 经 是 排序 数组 ， 则 很 容易 在 线性 时 间 内 完成 把 P 划分 为 
P， 和 P， 的 操作 。) 

在 每 次 调用 中 ， 我 们 希望 形成 一 个 排序 数组 的 排序 子 集 。 例 如 ， 给 某 个 特定 调用 的 输入 
为 子 集 P 和 按 y 坐标 排序 的 数组 Y。 把 P 划分 为 P, 和 Pe 后 ， 需 要 形成 按 y 坐标 排序 的 数 
组 Yi 和 YY。 这 些 数组 必须 在 线性 时 间 内 形成 。 我 们 所 用 的 方法 可 以 看 作 与 1.3.1 节 中 介绍 
的 合并 排序 过 程 MERGE 相反 : 在 把 一 个 排序 数组 分 成 两 个 排序 数组 。 下 列 伪 代 码 给 出 了 
这 种 思想 的 实现 。 


I length[YU 一 length[Yaje6 . 
for il to lengthfY] 
do 证 芋 占 坟 囊 ， 
then length[Y,]--iength[Y;]+l 
Y[lengthfY,]--YI ， 
clsc lenzgth[Yaj- 一 tength[Y ns]ti 
YLengthIYaDY 国 


-人 


我 们 仅仅 是 按 次 序 检查 数组 立 中 的 点 . 如 果 一 个 点 vi 在 Pi 中 ， 则 把 它 浴 加 到 数组 Y 
的 末端 ; 否则 ， 我 们 就 把 它 添 加 到 数组 冯 入 术 三 。 下 大 借 的 的 估 三 也 可 以 形成 数组 XI ， 
XR 和 下-。 
剩 下 的 问题 只 是 首先 如 何 可 对 点 进行 排序 . 我 们 仅 需 对 其 先行 玫 排 序 就 可 以 了 ， 即 在 第 一 
次 递归 调用 前 对 所 有 点 进行 排序 。 这 些 排 序数 组 被 传递 到 第 一 次 递归 调用 中 ， 在 那里 根据 需 
要 在 通过 递归 调用 时 再 对 其 进行 前 减 。 预 排序 使 运行 时 间 增加 了 Onlg n )， 但 这 样 一 来 路 
递归 调用 外 递归 过 程 的 每 一 步 仅 升 线 狂 时 间 。 如 果 设 T(nm) 为 每 个 递归 步 的 运行 时 间 , Tn) 
为 整个 算法 的 运行 时 间 ， 我 们 就 得 到 Tao) =Tm +Onlgn) 和 
Ta) `- { 2Tn7 2 二 Din) 如 果 n> 3 
OL1) 如 果 mn 瓜 3 
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因此 ，Tn) =Olnlgn)，Tn) =Otn ] 多 上)。 


思 考 题 
35-1 凸 层 
已 知 平面 上 的 点 集 Q， 我 们 用 归纳 法 来 定义 Q 的 凸 层 。Q 的 第 一 凸 层 是 由 Q 中 是 
CHIQ) 顶点 的 那些 点 组 域 。 对 i> 1， 定义 @ 击 把 和 中 所 有 在 凸 晨 1，2，…，1 中 的 点 


去 除 后 剩余 的 点 所 构 碟 。 如 果 口 基 下， 那么 Q 的 第 i 凸 姑 为 CHCQJ : 否则 第 主 思 层 无 定 
义 ， 
. 守 出 一 个 运行 时 间 为 Da2) 的 算法 以 找 出 个 点 组 成 的 集合 的 各 辆 层 。 
证 明 , 在 对 nm 个 实数 进行 排序 所 需 时 间 为 mtn le mn) 的 任何 计算 模型 上 ， 要 计算 出 n 个 . 
点 的 凸 层 需要 mtn lg nj) 时 间 。 


35-2 最 大 层 


设 Q 是 平面 上 na 个 点 组 成 的 集合 。 如果 有 xx 且 yyY， 我 们 说 点 《xm 中 支配 点 
y)。Q 中 不 被 其 中 任何 其 他 点 支配 的 点 称 为 最 大 点 。 注 意 ，Q 可 以 包含 许多 最 大 点 ， 
我 们 可 以 把 这 些 最 大 点 组 织 成 如 下 的 最 大 层 。 第 一 最 大 层 工 是 中 中 最 大 点 构成 的 集合 。 对 


i>1， 第 i 最 大 层 工 是 QU 工 中 的 最 大 点 构成 的 集合 。 


j=1 j . 
假设 Q 包含 k 个 非 空 的 最 大 层 ， 并 设 丰 是 工 中 最 左边 的 点 的 y 坐标 ，i= 1， 2，'…， 
k， 假 定 Q 中 没有 两 个 点 有 相同 的 x 坐标 或 y 坐标 。 四 
3a. 证 明 yi >y2> > 多 
考察 一 个 点 (x， 们 ， 它 在 中 中 任何 点 的 左边 ,并且 其 y 坐标 与 Q 中 任何 点 的 y 坐标 都 
不 相 则 。 设 Q=QLL Ge， 录 二 
b. 设 j 是 满足 六 <y 的 最 小 下 标 ， 除 非 y< yu 在 这 种 情况 下 我 们 设 j= k+1， 证 明 QQ 的 
最 大 层 如 下 : 
-如果 j 和 kxk， 则 久 的 最 大 层 与 中 的 最 大 层 相 同 ， 只 是 工 ; 也 和 信 {x， 光 作为 其 新 的 
左 点 。 
. 如 果 j=ktl， 则 Q 的 前 k 个 最 大 层 与 驴 相同 ， 但 此 外 ， Q 有 一 个 非 空 的 第 kx+1l 最 
太 层 : LI 三 { (x，y) 上 
c. 描 述 一 种 运行 时 间 为 On lg n) 的 算法 , 以 便 计算 出 n 个 点 的 集合 Q 的 各 最 大 层 . (所 
示 : 把 一 条 打 除 线 从 右 向 左 称 动 ) 
d. 如 果 多 许 输 入 点 有 相同 的 x 从 标 或 y 坐标 ， 会 不 会 出 现 问题 ?. 如 果 会 所 出 一 种 方法 来 
解决 这 种 问题 ， 


35-3 世人 和 鳃 


有 日 个 巨人 正 与 = 个 鬼 进 行 战斗 。 每 个 巨人 的 武器 是 一 个 质子 包 ， 它 可 以 用 一 襄 质 子 
流 射 中 曝 而 把 鬼 消 灭 ， 质 子 流 灌 直 线 行进 ， 在 击 中 鬼 时 就 余 止 。 巨 人 决定 采取 下 列 战 略 。 他 
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人 阁 各 村 拒 一 个 鬼 以 形成 n 个 巨人 -- 奥 对 ， 然 后 每 个 所 人 同时 向 他 或 她 选取 的 鬼 射 出 一 - 串 质 江 
流 。 我 们 知道 ， 让 质子 流 互相 交叉 是 很 艺 险 的 ， 因 此 巨人 选择 的 配对 方式 应 该 使 质子 流 都 全. 
会 迹 叉 。 

假定 每 个 巨人 和 每 个 拭 的 位 置 都 是 平面 上 一 个 转 定 的 点 ， 并 且 没 有 三 个 位 置 共 线 。 

a. 论 证 存在 一 条 通过 一 个 巨人 和 一 个 鬼 的 直线 使 直线 一 一 边 的 已 人 数 与 同一 按 的 鬼 数 相 
等 ， 试 说 明 如 何在 On lgm) 的 时 间 内 找 出 这 样 一 条 直线 。 

b. 写 出 一 个 运行 时 间 为 O(n lg nb) 的 算法 ， 使 其 按 不 会 有 质子 流 交 允 的 条 件 把 巨人 与 鬼 
配对 . 


35-4 ” 稀 访 包 分 布 


考虑 计算 平面 上 点 的 集合 的 凸 包 问 题 ， 但 这 些 点 是 根据 某 已 知 的 随机 分 布 取得 的 。 有 
， 从 这 样 一 种 分 布 中 取得 的 a 个 点 的 凸 包 的 期 望 规模 为 On “)，《 为 大 于 0 的 某 个 党 
， 称 这 样 的 分 布 为 稀 政 包 分布 。 称 栈 包 分 布 包括 以 下 凡 种 : 

. 点 是 均匀 地 从 一 个 单位 半径 的 圆 面 中 取得 的 。 凸 包 的 期 望 规 模 为 @(nl17 习 。 

- 点 是 均 与 地 从 一 个 具有 上 k 条 边 的 凸 多 远 形 内 部 取得 的 人 为 任意 常数 ) 。 凸 包 的 期 户 
规模 为 昌 (tgt。 

. 点 是 根据 二 维 正 态 分 布 取得 的 。 凸 包 的 期 望 规 模 为 @(Vlgn )。 

a. 己 知 商 个 分 别 有 m 和 由 个 顶点 的 凸 多 边 形 ， 说 明 如 何在 Oni+n;) 的 时 间 内 计算 出 
全 部 n+ny 个 点 的 凸 包 〈 多 边 形 可 以 重奏 )。 

b. 证 明 , 根据 稀 朴 包 分 布 独立 取得 的 一 组 mn 个 点 的 凸 包 可 以 在 Otn) 的 期 望 时 间 内 计算 
出 来 。 (提示 : 采 有 甲 递 妇 方法 分 别 求 出 前 mn72 个 点 和 后 mA2 候 点 的 凸 包 ， 然 后 再 对 结果 进 
行 组 合 .。 ) 


泛 亏 


练习 三 士 五 


35.1-1 证 明 如 果 pi, xb 为 正 ， 则 对 于 原点 但 0， 出 三 Pi 在 向 最 Ps 的 凑 时 外 方向 。 如 果 叉 积 为 
商 ， 则 p, 在 Ps, 的 涛 时 针 方 癌 。 

35.1-2 已 和 皇 一 个 由 了 个 点 组 成 的 序列 <p，bh，…， 上 > , 试 按 上 岸 列 中 各 点 刀 某 给 定 原 点 po 的 要 节庆 
小 革 访 序列 迁 行 排序 ， 写 出 排序 的 乙 代 码 。 所 给 出 的 过 程 的 运行 时 间 庶 为 DOln 习 ni ,并 村 天 用 六 各 来 比较 
角 的 大 小 。 

35.1-3 ” 试 说 明 如 何在 Onmzlg mn) 的 时 间 内 确定 一 组 上 个 点 中 和 任 启 三 点 十 否 基线 。 

35.41-4 Aimundsen 教授 提出 用 下 面 的 方法 来 确定 由 a 个 点 纽 成 的 序列 一 种 ，pi，…， 记 > 形成 一 个 
妇 多 边 形 的 各 连续 顶点 〔 参 见 第 16.4 节 中 关于 多 边 形 的 定义 )。 如 果 集 售 { ppupl i=0，1，…，nm 一 1 
其 中 下 标 加 法 是 对 矢 进行 的 ) 不 是 既 包 售 左 转 足 包含 布 转 ， 册 箱 出 *Yes" 否则 ， 输 出 “Neo"。 试 说 明 虽 然 
这 种 方法 的 运行 时 间 为 线性 时 间 ， 但 它 并 不 总 是 能 得 出 正确 的 结果 。 对 这 位 教 儿 的 六 法 进行 修改 使 其 总 能 
在 线性 时 间 后 得 出 正确 的 答案 

35.1-5 已 知 一 个 点 pe= 《xx，yo)，Ppo 的 右 水 平 半 直线 是 点 的 集合 人 Pi= (xy) :为 袜 xo 且 山大 加 上 
即 它 是 m 点 正 右 方 的 点 的 集合 ， 包 舍 ps 本 身 。 试 说 明 如 何 通过 把 问题 转化 为 确定 两 亲 线 段 是 理 相 交 的 问 
是, 在 OL1) 的 时 间 内 确定 给 定 的 pe 的 右 水 半 半 直线 是 否 与 线段 PP- 相交 。 

35.1-6 确定 一 个 点 是 和 哲 是 一 个 简单 和 多边形 P 【不 一 定 是 目 和 多边 形 ) 内 部 的 一 种 方法 是 给 查 po 的 任 
何 半 直线 ， 辕 它 是 否 与 和 多边形 了 的 边界 相交 奇数 次 ， 但 po 本 身 不 能 处 于 了 的 边界 上 。 试 说 明 如 何在 @@fn) 
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的 时 间 内 计算 出 眠 pe 证 天 在 n 个 预 点 组 成 的 多 边 形 的 内 部 。 (提示 :; 利用 练习 35.1-5。， 要 保证 使 所 给 出 的 
算法 在 于 直线 纯 多 边 形 的 边界 相交 于 某 顶 点 时 与 在 半 直 线 选 盖 住 和 多边 形 的 一 条 边 时 都 能 得 出 正确 结果 .) 

35.1-7 术 说 明 如 何在 加 tm) 的 时 间 内 计算 出 个 顶点 组 成 的 简单 多 边 形 〈 但 不 一 定 是 凸 多 边 形 ) 的 
面积. 


33.2-1 证 明 ; 在 mn 条 线段 中 可 能 有 Btn ) 个 交点 。 

3S.3-2 已 知 两 条 在 x 可 比 的 不 相交 线段 a 和 b， 试 说 明 如 和 何 利 用 受 积 在 Di) 时 间 内 确定 a> ,b 利 
b>,a 中 旦 -- 个 成 忆 。 _ 

35.3-3 用 人 建议 修改 过 程 ANY-SEGMENTS-INTERSECT 以 炳 其 不 是 找 出 一 个 相交 点 后 就 逝 
世面 是 找 印 由 相交 的 线段 再 继续 进行 for 循环 的 下 一 次 竟 代 。 他 称 这 样 得 到 的 过 程 为 PRINT-TNTER- 
SECTING-SEGMENTS、 并 声称 该 过 程 能 够 按照 线段 在 集合 中 出 现 的 次 序 从 左 到 右 打 印 出 所 有 的 交点 。 
试 举 出 -- 组 线段 的 例 上. 使 得 运用 过 程 PRINT-INTERSECTING-SEGMENTS 所 找 出 的 第 一 个 相交 点 不 
是 最 在 林 安 点 . 琢 举 出 一 组 线段 的 例子 使 过 程 PRINT-INTERSECTING-SEGMENTS 不 能 找 出 所 有 的 相 
区 战 。 

35.2-4 1 上 引 一 个 运行 时 间 为 Oftn lgn) 的 算 苇 以 确定 由 nm 个 顶点 组 成 的 和 多边形 是 否 是 简单 和 多边 形 。 

35.2-5 宇 出 一 个 运行 时 间 为 On ] 相 my 的 算法 以 确定 总 共有 8 个 顶点 的 两 个 简单 多 边 形 是 否 相 交 。 

35.2-6 一 个 圆 面 是 由 一 个 圆 加 上 其 内 部 组 成 , 并 且 用 困 心 和 半径 来 表示 。 如 果 两 个 圆 面 有 任何 公共 
点 ， 则 这 央 个 罗 而 林立， 呈 出 一 个 运行 时 全 为 On ljgm 的 算法 , 以 确定 一 组 nm 个 圆 面 中 是 否 有 任何 两 个 圆 
面相 安 ， 

35.2-7 让 知 n 条 线段 中 总 共和 包含 上 个 交点 ， 试 说 明 如 何在 OK(n+k]) 怒 m 的 时 间 内 输出 全 部 k 个 交 

35.2-8 试 说 明 如 和 何 实现 红 - 黑 树 过 程 , 使 得 即便 存在 某 些 科 直 线段 或 有 三 条 线段 相交 于 同一 点 ， 过 程 
ANY-SEGMENTS-INTERSECT 也 能 正确 执行 。 证 明 所 给 出 的 实现 方法 是 和 正确 的 。 


3s.3-1 证 明 , 在 过 程 GRAHRAM-SCAN 中 ， 点 Pi 和 P， 必定 是 CHIQT 的 顶点 。 

335.3-2 考虑 一 个 能 支持 加 法 、 比 较 和 乘法 的 计算 模型 ， 用 该 模型 对 n 个 数 进 行 排序 时 存在 一 个 下 限 
tn lgnly。 证 明 : 当 在 这 样 一 个 模型 中 有 序 地 计算 出 个 点 组 成 的 桌 合 的 吊 包 时 ， 其 下 限 为 Dln lgn)。 

35.3-3 已 知 点 的 集合 局， 证 明 彼此 间距 离 最 远 的 点 对 必定 是 CHI(Q) 的 顶点 。 

35.3-4 对 给 定 的 一 多 按 形 P 和 在 其 边界 上 的 一 个 点 q，dq 的 阴影 是 满足 线 颖 qr 完全 在 边界 上 或 在 P 
的 瀣 部 的 点 的 集合 。 如 果 在 已 的 内 部 存在 一 个 点 P 处 于 P 的 边界 上 每 个 点 的 阴影 中 ， 关 多边 形 下 是 星 展 
多 边 形 。 所 有 满 是 这 种 条 件 的 点 p 的 祭 合 称 为 卫 的 肉 核 (参见 图 35.12 中 (a) 星 形 多 边 形 :， (bj 非 星 形 多 
边 形 )， 给 定 一 全 nm 个 质点 的 性 形 多 边 形 P 按 道 时 针 方向 排序 的 各 个 顶点 ， 试 说 明 如 何在 O(n) 的 时 间 内 计 
条 出 CHLP). 





《8) 
Ri 3..12 ， 乡 习 35.3-4 中 用 到 的 是 形 多 边 形 的 定义 
35.4-5 在 联机 目 包 问题 中 ， 每 次 只 给 出 mn 个 点 组 成 的 集合 QQ 中 的 一 个 点 。 在 接收 到 竺 个 点 后 ， 我 们 
就 计 在 出 目前 所 见 到 的 点 的 贞 包 ， 号 热 ， 我 们 可 以 对 每 个 点 运行 一 次 Graham 扫描 算法 ， 整 个 运行 时 间 为 
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Qtaagaly。 试 说 明 如 何在 Don5 的 时 间 内 解决 联机 凸 包 问 题 . 
35.3--6 ” 试 说 明 如 何 实现 增 量 方法 , 使 其 在 Danlgm 的 时 间 肉 计算 出 个 点 的 上 四 人世。 


35,4-1 有 人 提出 了 一 个 方案 , 即 在 量 近 点 对 算法 中 检查 数组 立 "让 登 个 点 后 而 的 5 个 点 。 其 思想 是 总 是 
把 直线 1 上 的 点 放 人 集合 PL 中 。 那 么 直线 1 上 上 就 不 可 能 有 一 个 点 属于 PL， 另 一 个 扎 展 于 P 的 重合 把 对。 
因此 ，。 至 多 可 能 有 后 个 几 处 十 匡 x 站 的 此 形 肉 。 这 种 方案 的 缺 糙 何在? - 

35.4-~2 如 果 不 增加 算法 在 淋 和 近 意 义 上 的 运行 时 间 ， 试 说 明 如 何 保证 传递 到 第 一 次 递归 调 轴 的 总 的 所 
全 中 不 包 售 重 全 点。 证明 这 样 一 来 充 需 检查 数组 立 ' 中 跟随 每 个 点 后 的 6 个 【而 示 是 了 个 ) 上 笋 组 位 距 上 的 咸 
就 足够 了 .为 什么 仅 检查 跟随 等 个 点 后 的 5 个 数组 位 置 上 的 点 还 不 行 ? 

35.4-3 两 个 点 之 间 的 距离 除 欧 氏 距离 外 还 有 其 他 定义 方法 。 在 平面 工 ， 点 m 和 pa 的 Lo 上 离 由 下 式 
给 出 : ( (xi-x2) "+ (7i 一 Ya) nm 一 、 因 此 ， 葡 氏 上 离 实际 上 是 L: 卓 离 ， 往 改 最 近 点 对 算法 使 其 能 计算 L; 
距离 ， 也 称 为 Manhattan 上 距离. 

35.4-4 已 志平 商 上 的 两 个 点 B 和 P。 它 们 之 阐 的 L 枉 离 为 max (fx 一 x|，lyi 一 ya ]。 修 改 最 近 点 对 
算法 使 其 能 计算 L 虐 商 . 
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第 三 十 六 章 ”NEP-- 完 全 性 


迄今 为 止 , 我 们 学 习 过 的 所 有 算法 都 是 多 项 式 时 间 的 算法 : 对 规模 为 虽 的 输入 ， 它 们 在 
最 坏 情 况 下 的 运行 时 间 为 Dtn')，k 为 某 个 常数 。 读 者 会 问 : 是 否 所 有 问题 都 能 在 多 项 式 时 
间 内 解决 ? 答案 是否 定 的 。 例 如 ,存在 一 些 问 题 ， 如 图 灵 著 名 的 “停机 问题 *， 任 何 计算 机 不 
论 耗 竟 多 少时 间 也 不 能 解决 。 还 有 一 些 问 题 可 以 解决 ， 但 对 任意 常数 kk， 它们 都 不 能 在 
OU ) 的 时 间 内 得 到 解答 。 一 般 来 说 ， 我 们 把 可 由 多项式 时 间 的 算法 解决 的 问题 看 作 是 易 
处 理 的 问题 ， 而 把 需要 超 多 项 式 时 间 才能 解决 的 问题 看 作 难 处 理 的 问题 。 

本 章 的 主题 是 一 类 称 为 *NP-- 完 全 "的 有 趣 问 题 , ， 迄 今 为 止 ， 既 设 有 人 找 出 求解 NP-- 完 
全 问题 的 多 项 式 时 间 的 算法 ， 也 没有 人 证 明 对 这 类 问题 的 任何 超 多 项 式 时 间 的 下 痕 。 自 
1971 年 提 世 这 一 问题 以 后 ，P 关 NP 问题 已 成 为 计算 机 学 科 的 理论 研究 中 最 深奥 和 最 错 综 复 
杂 的 未 解决 问题 之 一 . 

大 多 数 摘 理 论 研 究 的 计算 机 专家 认为 , NP- 完 全 问题 是 难处 理 的 问题 。 其 理由 是 如 果 任 
何 一 个 NP-- 完 全 问题 可 以 在 多 项 式 时 间 内 得 到 解 块 的 话 ， 那 么 每 一 个 NP- 完 全 问题 就 都 有 
一 个 多 项 式 时 间 的 解决 算法 。 

在 馆 今 为 止 研 究 过 的 广泛 的 NP-- 完 全 问题 中 ， 我 们 在 获得 多 项 式 时 间 解 法 方面 没有 了 到 
得 任何 进展 ， 凶 此 ， 如 果 全 部 NP- 完 全 问题 都 能 在 多 项 式 时 间 内 获得 解决 ， 那 将 会 是 令 人 
震惊 的 成 果 。 

为 了 成 为 一 个 优秀 的 算法 设计 者 ， 读 者 必须 人 懂得 关于 NP- 完 全 问题 的 基本 原理 。 如 果 
读 老 能 建立 一 个 NP- 完 全 问题 ， 就 可 以 提供 充分 的 论证 说 明 其 难处 理性 。 作 为 一 个 软件 工 
程 师 ， 更 好 的 做 法 是 花 时 间 开 发 一 种 近似 算法 〈 见 第 三 十 七 章 )， 而 不 是 寻找 求 得 问题 确切 
解 的 一 种 快速 算法 。 此外， 从 表面 上 看 ， 很 多 自然 而 有 趣 的 问题 并 不 比 排序 、 图 的 搜索 或 网 
络 流 问题 更 困难 ， 租 事实 上 它们 却 是 NE-- 完 全 问题 。 

本 章 主 要 全 究 最 直接 地 产生 于 等 法 分 析 中 的 NP- 完 全 问题 的 几 个 方面 。 在 36.1 节 中 ， 
我 们 对 * 问 题 "这 一 概念 作 形 式 化 定义 ， 还 要 定 尽 在 多 项 式 时 间 内 可 解 的 判定 问题 的 复杂 类 
P， 间 时 也 要 看 看 这 些 概 念 如 何 与 形式 语言 的 理论 结构 相 适 夭 。36.2 节 中 定 了 关于 关 定 问题 
的 NP 类 ， 我 们 可 以 多 项 式 时 间 内 验证 其 解 。 在 该 节 中 我 们 还 要 正式 提出 P 关 NP 问题 ， 
36.3 节 主 要 讨论 如 何 通过 多 项 式 时 间 的 “化 简 * 来 研究 问题 之 间 的 关系 。 它 定义 了 NEPE- 完全 
性 , 并 概 述 了 一 个 称 为 “电路 可 满足 性 "的 问题 是 NP- 完 全 性 问题 的 证 明 过 程 。 在 找 出 一 个 
NPE- 完 全 问题 之 后 ， 我 们 在 36.4 节 中 主要 讨论 如 何 利用 化 简 方 法 学 更 简便 地 证 明 其 他 一 些 
问题 也 是 NP-- 完 全 问题 ， 主 要 是 通过 证 明 两 个 公式 可 满足 性 问题 是 NP- 完 全 问题 来 阐述 化 
简 方 法 学 。36.5 节 中 说 明了 具有 NEP-- 完 全 性 的 各 种 其 他 问题 . 
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36.1 多项式 时 间 


在 学 习 NP-- 完 全 性 之 前 ， 我 们 先 来 定义 多 项 式 时 间 可 解决 问题 。 这 些 问 题 一 般 看 作 易 
处 理 问 题 。 其 原因 是 一 个 哲学 问题 ， 而 不 是 数学 问题 。 我 们 可 以 提供 汪 点 论据 ， 

第 --、 虽 然 把 所 需 运 行 时 间 为 Bn) 的 问题 作为 难处 理 问 题 也 有 鞭 合 理 之 处 ， 但 在 实 
际 中 需 鉴 如 此 高 次 的 多 项 式 时 间 的 问题 是 非常 少 的 。 在 实际 中 遇 到 的 典型 的 多 项 式 时 间 可 解 
问题 所 融 的 时 间 要 比 上 上述 少 得 多 。 

第 -.， 对 很 多 合理 的 计算 模型 来 说 ， 在 一 个 模型 上 用 多 项 式 时 间 可 解 的 问题 , 在 另 一 个 
模型 上 上 也 可 以 在 多 项 式 时 间 内 蓝 得 解决 。 例 如 ， 用 本 书 中 大 部 和 分 所 使 用 的 串 行 随 视 存 取 计 算 
机 在 多 项 式 时 间 内 可 求解 的 问题 类 , 与 抽象 的 图 灵机 上 在 密 项 式 时 间 内 可 求解 的 问题 类 是 相 
同 的 。 它 也 与 和 用 并 行 计 算 机 在 多 项 式 内 可 求解 的 问题 类 相同 ， 即 使 处 理 器 数 日 随 输 入 规模 
以 多 项 式 绥 数 增 邵 也 是 这 样 。 

第 过 ， 多 项 式 时 间 可 解 问 题 类 都 具有 很 好 的 赶 闭 性 ， 这 是 因为 在 如 法 、 乘 法 和 组 人 台 运 算 
下 多 项 式 是 封闭 的 。 例 如 ， 如 果 一 个 多 项 式 时 间 算 法 的 输出 针 送 给 另 一 个 多 项 式 时 间 算 法 作 
为 输入 ， 则 得 到 的 组 合算 法 也 是 多 天 式 时 间 算 法 。 如 果 另 外 --- 个 多 项 式 时 间 算 法 对 一 个 多 项 
式 时 间 - 子 程序 进行 常数 次 调用 ， 那 么 组 合算 法 的 运行 时 间 也 是 多 项 式 时 间 。 


抽象 问题 


为 了 弄 请 楚 多 项 式 时 间 可 解 问 题 关 ， 首 先 必 须 对 “问题 "这 一 概念 进行 形式 化 定义 。 我 们 
定义 抽象 条 题 Q 为 定义 在 问题 实例 集合 工 和 问题 解法 集合 S 上 的 一 个 一 元 关系 。 例 如 ， 考 
察 在 无 权 开 向 闭 G=(V，E) 中 寻找 两 个 指定 结 点 间 的 最 短路 从 问题 


组 ， 其 解 为 图 中 的 结 点 序列 ， 序 列 可 能 为 空 ， 这 表示 两 结 点 间 不 存在 路 径 。 问 题 SHORT 
EST-PATH 本 与 号 是 把 一 个 图 和 了 棒 个 结 点 的 一 个 实例 与 图 中 联系 这 两 个 结 点 的 最 短路 径 联 
系 在 -- 起 的 关系 。 因 为 最 短路 径 并 不 一 定 唯 一 ， 因 此 一 个 给 定 的 问题 实例 可 以 有 多 个 解 。 

抽象 问题 的 这 一 形式 定义 对 我 们 的 要 求 来 说 显得 太 敌 统 。 为 了 简单 起 见 ，NP- 完 全 性 
理论 把 注意 力 集中 在 兰 定 问题 上: 即 那 些 解 为 是 或 否 的 问题 。 平 是 ， 我 们 可 以 把 抽象 的 斋 定 
问题 看 作 是 从 实例 集 上 映射 到 解 集 {0。1 上 的 一 个 函数 。 例 如 ， 与 最 短路 径 问 题 有 关 的 判定 
问题 PATH 为 ; "已 知 一 个 狗 G=(V，B)7， 两 个 结 点 u，vCV 和 一 个 非 负 整数 k， 园 G 中 
在 u 和 v 之 间 是 否 存 在 一 条 长 度 至 多 为 的 路 径 ?" 如 果 i= 《G，u，v，k> 是 该 最 短路 各 
问题 的 一 个 实例 ， 那 么 如 果 从 _ 到 的 最 短路 径 的 长 度 至 多 为 k， 则 PATHG) =1 (是 )， 
否则 PATHG) =0《( 香 )。 

许多 抽象 问题 并 不 是 判定 问题 , 而 是 最 优化 问题 。 在 这 些 问 题 中 必须 求 出 某 个 量 的 最 大 
值 或 最 小 值 。 为 了 使 NP- 完 全 理论 适用 于 最 优化 问题 , 我 们 必须 对 其 进行 彻底 改动 而 使 其 成 
为 判定 问题 。 一 般 来 说 , 可 以 通过 对 要 进行 优化 的 值 加 上 一 个 限制 范围 来 进行 改写 。 例 如 ,在 
改写 最 短路 径 问 题 为 判定 问题 PATH 的 过 程 中 ,我 们 把 限制 范围 k 加 到 问题 实例 中 。 

尽 竺 NP- 完 全 理论 旨 求 我 们 把 最 优化 问题 改 为 判定 问题 ， 但 是 这 -一 要 求 并 不 会 鹿 弱 该 
理论 的 影响 ， 布 … 般 情况 上， 如 果 我 们 能 够 较 快 地 解决 一 个 最 优化 问题 ， 我 们 仅仅 是 把 从 最 
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优化 问题 的 解 中 获得 的 值 与 作为 判定 问题 输入 的 限制 范围 进行 比较 。 如 果 一 个 最 优化 问题 是 
容易 求解 的 , 用 与 NP-- 完 全 性 更 贴切 的 话 来 说 ， 如 果 我 们 能 够 提供 证 据说 明 一 个 判定 问题 是 
难 求解 的 ， 那 么 我 们 提供 的 证 据 也 可 以 说 明 与 其 相关 的 最 优化 问题 是 难 求解 的 。 因 此 ， 即 便 
我 们 仅 限 址 考虑 判定 问题 ，NP- 尘 全 理论 也 同样 有 更 广泛 的 适 町 姓 。 


编码 


如 果 要 用 一 个 计算 机 程序 来 求解 一 个 抽象 问题 ， 我 们 就 必须 用 一 种 程序 能 明白 的 方式 来 
表示 问题 实例 。 抽 象 物体 集合 S 的 编码 是 从 S 到 二 进 制 的 映射 e。 (e 的 梯 域 不 一 定 是 二 进 制 
串 ， 至 少 和 包含 商 个 符号 的 腿 字 母 表 上 串 的 任意 集合 都 可 以 .) 例如 ， 我 们 都 束 悉 把 自然 数 
N={10，1，2，3，4，…} 编 码 为 串 10，1，10，11，100，…}，、 在 这 种 编码 方式 中 ，ef17) 
=10001。 任 何 看 过 计算 机 键盘 字符 的 表示 法 的 人 都 会 熟知 ASCiI 码 或 EBCDIC 码 。 在 
ASCII 码 中 ，e(A) = 1000001。 即 使 对 一 个 复合 对 象 ， 我 们 也 可 以 通过 把 其 组 成 部 分 的 表 
示 进 行 组 合 把 它 编码 为 一 个 二 进 制 串 。 多 边 形 、 图 ，、 函 数 、 有 序 对 、 程 序 一 -所 有 这 些 都 可 
以 编码 为 二 进 制 串 。 

因此 , "求解 " 某 个 抽象 判定 问题 的 计算 机 算法 实际 上 是 把 一 个 问题 实例 的 编码 作为 其 输 
人 。 我 们 把 实例 集 为 一 进 制 串 的 集合 的 问题 称 为 具体 问题 。 如 果 当 提供 给 一 个 算法 的 是 长 度 
n=|i 的 一 个 问题 实例 i 时， 算法 至 多 在 OCT(n)) 的 时 间 内 就 能 产生 问题 的 解 ， 我 们 就 说 该 
算法 在 时 间 OUTOn) ) 内 解决 了 该 具体 问题 。 因 此 ， 如 果 对 某 个 常数 k， 存 在 一 个 算法 能 在 
时 间 Onx) 内 求解 出 某 具 体 间 题 ， 那 么 我 们 就 说 该 具体 问题 是 多 项 式 时 间 可 解 的 。 

现在 , 我 们 可 以 正式 定义 复杂 类 了 是 在 多 项 式 时 间 内 可 解 的 具体 判定 问题 的 集合 。 

我 们 可 以 运用 编码 使 抽象 问题 映射 到 具体 问题 给 定 一 个 抽象 判定 问题 Q， 其 上 映 射 为 
实例 集合 工 到 10，1， 我 们 可 以 利用 一 种 编码 e: ={0，1}*， 引 出 一 个 相关 的 具体 判定 问 
题 ， 用 etQ) 来 表示 。 如 果 一 个 抽象 问题 实例 iEI 的 解 为 QG) 《 {0，1}j， 则 该 具体 问题 实 
例 esi 、 种，1 的 解 也 是 Qti)。 可 能 存在 一 些 表示 无 意义 的 抽象 问题 实例 的 二 进 制 串 。 为 
了 方便 起 见 ， 我 们 假定 任何 这 样 的 串 都 映射 到 0。 因 此， 对 表示 抽象 问题 实例 的 编码 的 一 进 
制 串 实例 ， 具 体 问 题 与 抽象 问题 产生 同样 的 解 ， 

我 们 希望 利用 编码 作为 桥梁 , 把 多 项 式 时 间 可 解 性 的 定义 从 具体 问题 扩展 到 抽象 问题 ， 
但 同时 也 希望 这 一 定义 与 任何 特定 的 编码 无 关 ， 即 求解 一 个 问题 的 效率 不 应 依赖 于 问题 的 编 
码 。 不 过 的 是 ， 这 种 依赖 性 相当 严重 。 例 如 ， 假 定 把 一 个 整数 上 作为 一 个 算法 的 唯一 输 
入、 并 设 算法 的 运行 时 间 为 @(kc)。 如 果 提供 的 整数 上 是 一 元 的 -一 飞 个 1 组 成 的 串 一 -对 
长 度 为 习 的 输入 ， 该 算法 的 运行 时 间 为 On)， 它 是 多 项 式 时 间 。 但 是 , 如 果 我 们 用 更 自然 的 
二 进 制 来 表示 整数 k， 则 和 输 大 长度 为 n= flgk 1。 在 这 种 情况 下 ， 该 算法 的 运行 时 间 为 
etk) =e@(2)， 它 是 输入 规模 的 寡 。 因 此 ， 根 据 编 码 的 不 同 ， 算 法 的 运行 时 间 可 以 是 多 项 
式 时 间或 超 多 项 式 时 间 。 

因此 ,对 一 个 抽象 问题 进行 编码 对 理解 多 项 式 时 间 是 相当 重要 的 。 如 果 不 先 指定 编码 ,我 . 
位 就 不 可 能 走 正 谈 及 对 -个 抽象 问题 的 求解 。 然 而 在 实际 应 用 中 ,如 果 我 们 不 采用 “代价 商 晶 
的 " 编 玛 (如 一 元 编码 ), 那 么 问题 的 实际 编码 形式 对 问题 是 否 能 在 多 项 式 时 间 内 求解 的 影响 是 
微 不 吓 道 的 。 例 如 ,以 3 代替 2 为 基数 来 表示 整数 对 问题 是 否 能 在 多 项 式 时 间 内 求解 没有 任 
何 影响 ,因为 以 基数 3 表示 的 整数 可 以 在 多 项 式 时 间 内 转换 为 以 基数 2 表示 的 整数 。 
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对 一 个 盯 数 下 10，1 生 :=10，1 才 ， 如 果 存 在 一 个 多 项 式 时 间 算 法 A 可 以 对 任意 给 定 的 
输 人 人 xv 10，14”， 让。 我 放生 一 个 下 国术 的 村 
问题 实例 的 某 个 集合 1， 如 果 存 在 两 个 多 项 式 时 间 可 计算 的 函数 人 和 f 满 是 对 任意 1 1， 
有 s(elifi)) 三 esfi) 了 Pifexi) =ei， 我 们 就 说 这 两 种 编码 e 和 所 是 和 多项式 相关 的 。 
亦 即 ，es(i 可 以 出 一 个 多 项 民 时 间 算 法 根据 编码 四 站 求 山 ， 反 之 亦 然 。 如 果 某 一 抽象 问题 
的 两 种 编 枉 el 和 ee, 是 多项式 相关 的 ， 则 如 下 面 引 理 所 述 ， 选 昨 哪 种 编码 对 阅 题 本 身 是 否 是 
多 项 式 时 间 可 解 没 有 关系 。 

引 理 36.1 设 虽 是 定义 在 一 个 实 语 集 工 上 的 一 个 抽象 判定 问题 ，el 和 ee 是 工 上 客 项 式 
相关 的 编码 ， 则 eltQ) 《PP 当 凡 仅 当 ex(Q) 扩 了 。 

”证 明 : 我 们 仅 尖 证 明 一 个 方向 ( 正 向 )， 因 为 反 向 与 正 向 是 对 称 的 。 仍 定 对 某 常 数 KK， 
eaQ 能 够 在 OUn':) 时 间 内 求解 。 此 外 ， 再 假定 对 任意 问题 实例 1 和 某 个 常数 c， 根 据 编码 
exti) 可 以 在 寻 间 On) 内 计算 出 编码 et， 其 中 m=felG 1， 为 了 对 输入 ex(D 解 问题 
estQ， 我 们 先 计 算出 e， 然 后 在 输入 et 上 运行 关于 ei(Q) 的 算法 。 这 需要 多 长 时 间 ? 
代码 变换 所 着 的 时 间 为 Qnr， 因此 上 1=Oo)， 这 是 因为 串 行 计 算 机 的 输出 不 可 能 比 其 
运行 时 间 下 长 。 所 以 求解 关于 6 的 问题 所 融 时 间 为 De 和 | =On)， 困 为 c 和 KK 都 
是 沦 数 ， 所 以 这 也 是 多 项 式 时 间 。 

因此 ， 对 一 个 抽象 问题 的 实例 用 一 进 制 或 兰 进 制 来 进行 编码 对 其 "复杂 性 "都 没有 影响 ， 
斌 证 说 ， 对 其 是 下 为 多 项 式 时 间 可 解 没 有 关系 。 但 是 ,如 果 对 实例 进行 一 元 编码 ， 则 其 复杂 
性 可 能 会 灾 化 。 为 了 能 够 用 -种 与 编 码 泡 关 的 方式 进行 描述 ， 我 们 一 般 假 定 用 含 理 的 、 简 涉 
计 方 式 对 问题 实例 进行 编码 ， 除 非 我 们 特别 另外 指明 ， 更 精确 好说， 我 们 将 假定 一 个 整数 的 
编码 与 其 - 进 制 表示 是 多 虎 式 相关 的 ， 并 用 一 个 有 限 集合 的 编 友 与 其 相 庶 的 括 在 括号 中 、 污 
素 间 证 逗 避 随 开 的 列表 的 编 伍 是 洛 项 式 相 关 的 【ASCII 码 就 是 这 样 一 种 编码 方案 )。 有 了 这 
样 一 种 * 标 准 " 编 码 ， 我 们 就 可 以 合理 地 推导 出 其 他 数学 对 象 如 元 组 、 图 和 公式 等 的 编码 。 为 
了 表示 一 个 对 象 的 标准 编码 ， 把 该 对 象 用 尖 括 号 括 起 来 ， 如 《Gy> 表示 图 台 的 标准 编码 。 

只 要 隐 式 地 使 用 与 标准 编码 多 项 式 相 关 的 编码 ， 就 可 以 豆 接 讨论 抽象 问题 而 无 需 参 照 任 
鸽 特定 编 好 ， 内 为 我 们 马 经 知道 选取 缠 码 对 该 也 题 是 否 为 多 项 式 时 间 本 求解 问题 股 有 任何 影 
响 ， 今 后 ， 我 们 一 般 假 设 所 有 问题 实例 都 是 采用 标准 编码 的 二 进 制 串 ， 除 非 我 们 显 式 地 指明 
其 他 情况 。 我 们 也 将 牧 略 抽象 问题 与 具 恒 问题 的 羔 罚 。 人 是， 读者 也 应 该 注意 对 实际 中 产生 
的 某 些 问题 ， 其 标准 缩 码 并 非 显 而 易 见 的 ， 并 且 此 时 编码 方式 对 问题 的 求解 的 确 产 生 影响 。 


形式 语言 体系 


判定 问题 可 以 与 形式 语言 理论 计算 机 联系 起 来 。 我 们 先 来 回顾 一 下 形式 语言 理论 中 的 一 
些 定义 。 字 蔷 表 工 nt 字 和 母 表 荆 上 的 语言 工 是 王 中 符号 组 成 的 串 的 任意 集 
会。 例如 ， 如 时 工 = 10、1， 集 合 L={110，11，101，111，1011，1101，1001，…} 是 关于 
素数 的 - 浊 制 二 导 的 这 可 。 我 们 用 * 表示 罕 串 ， 用 中 表示 守 司 育 。 王 上 所 在 囊 构 成 的 语 宕 
表示 为 工 。 例 如 ， 如 果 王 = 10，1， 则 王 ” ={e，0，1, .00，01，10，11，000，…} 就 是 所 
有 一 进 制 串 的 集合 , 三 上 的 每 个 语言 工 都 是 互 的 一 个 子 集 。 

集合 \ 论 中 的 运 等 旭 半 与 变 ) 都 可 以 作用 于 语言 上 。 我 们 定义 工 的 补 为 直 = 王 "一 L。 两 种 
过半 工 | 和 ,的 许 凤 是 请 许 
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EL 一 人 xx :xiALI 上 xf 工 } 
语言 工 的 闭 包 (Kieene 星 ) 为 语言 
EL = 人 ULUEUE 司 … 
其 中 三 是 世 与 其 自身 进行 k 次 并 壮 运 算 后 所 得 到 的 语言 。 
从 语言 理论 的 观点 来 看 ， 任 何 判定 问题 只 的 实例 集 即 集合 王 " ， 二 中 王 = 10， 二 因为 
Q 完全 是 由 那些 其 答案 为 1 (是 ) 的 问题 实例 来 刻 划 的 ， 所 以 我 们 可 以 把 急 看 作为 定妆 在 
工 = 10，11} 上 的 - -个 语言 荆 ， 其 中 
L=itx、z :Qoxl =1 
全 好， 与 判定 问题 PATH 对 应 的 语言 为 
PATH = 《Guvk> :G=(tV，BE) 是 一 无 而 图 ， 
U，VL W， 
k 闻 0 是 一 个 整数 ， 图 G 中 从 u 到 v 存 在 -条 长 并 容 多 为 k 的 
路 径 } 
(在 方便 的 时 候 、 我 们 有 时 将 用 同一 个 名称 一 一 如 上 述 情况 中 的 PATH 一 一 来 表示 一 个 判定 
问题 和 :与 其 相应 的 滞 许 。 
形式 语言 体系 可 以 用 来 表述 判定 问题 与 求解 这 些 问题 的 算法 之 问 的 关系 。 如 果 对 给 定 输 
入 X， 算 法 输出 A(x) = 1， 我 们 就 说 算法 A 接受 种 xC {0，1} 。 被 算法 A 接受 的 语言 是 集 
合 L= {x、10、1 : A0oo = 起 ， 即 为 算法 所 接受 的 串 的 集合 。 如 果 Atx) =0， 则 说 算法 
和 拒绝 串 x。 . 
即使 语言 直 被 算法 A 所 接受 ， 该 算法 也 不 一 定 拒绝 一 个 输入 串 雁 直 。 如 果 每 个 二 进 制 
申 要 么 被 竹 法 A 接受 ， 归 么 被 其 拒绝 ， 巾 说 语言 二 出 算法 A 判定 ， 如 果 对 任意 长 庆 为 虽 的 
串 x.、L 和 和 某 个 常数 k， 算 法 A 在 时 间 .On“) 内 接受 x， 则 语言 工 在 多 项 式 时 间 内 被 算法 A 
接受 ， 如 果 对 上 上 任意 长 度 为 避 的 串 xK {0， 十 “和 某 个 常数 k， 算 法 A 可 在 时 间 On'*) 内 莉 
宝 x， 崖 我们 说 语言 二 在 多 项 式 时 间 内 被 算法 A 判定 ， 因 此 ， 上 要 嫌 受 一 个 语言 ， 算 法 必须 
立 受 或 者 拒绝 10，11 中 的 每 一 个 串 。 
例如 ， 语 总 PATH 能 够 在 多 项 式 时 间 内 被 接受 。 邯 先 运用 宽 氏 优先 搜索 的 多 项 式 时 间 
接受 算法 计算 出 G 中 从 ua 到 v 的 最 短路 径 ， 然 后 把 得 到 的 距离 JJ 比较 。 如 果 愿 离 孚 多 为 
k， 则 钳 法 输出 1 并 停机 ; 和 耕 则 ， 该 算法 永远 运行 下 去 。 但 是 ， 这 一 算法 并 没有 类 是 
PATH， 因 为 对 最 短路 从 长 度 大 于 k 的 实例 ， 算 法 并 没有 显 式 地 输出 0。 关 于 PATH 的 判 
定 问 是 必须 是 式 好 拒绝 不 属于 PATH 的 一 进 制 串 ， 对 如 PATH 这 样 的 判定 问题 来 说 ， 很 容 
设计 出 这 样 … 种 判定 算法 。 供 对 其 他 一 些 问题 ， 如 图 如 机 停机 阿 题 ， 只 存在 接受 算法 ， 而 不 
存在 任何 判定 算法 。 
我 们 可 以 非 形式 地 定义 -个 复杂 类 为 语言 的 一 个 集合 ， 其 中 的 元 素 由 确定 一 个 给 定 的 串 
xx 是否 属于 语言 工 的 算法 上 的 复杂 性 度量 (如 运行 时 间 ) 所 确定 。 不 过 ， 从 某 种 意义 上 来 说 ， 
复杂 类 的 准确 定义 述 涉及 更 多 的 专业 知识 ， 有 兴趣 的 读者 可 以 进一步 参考 其 他 一 些 书 籍 。 
， 运 州 语言 理论 体系 ， 我 们 可 以 提出 关于 复杂 类 记 的 另外 一 种 形式 定义 : 
P=14LE {0，1 上 : 存在 一 个 算法 A 能 在 多 项 式 轩 间 内 判定 工 | 
吝 实 上 ，P 于 是 能 在 多 项 式 时 间 内 被 接受 的 语言 类 . 
定理 36.2 = 1{!L:， L 能 被 一 个 多 项 式 时 间 的 算法 所 接受 }。 
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证 明 : 因为 由 多 项 式 时 间 算 法 判定 的 语言 类 是 多 项 式 时 间 算法 接受 的 语言 类 的 -个子 
集 ， 所 以 我 们 仅 需 证 明 如 果 L 被 一 个 多 项 式 时 间 的 算法 接受 ， 它 也 能 被 一 个 多 项 式 时 间 的 
算法 判定 。 设 L 是 被 某 个 多 项 式 时 间 算 法 A 所 接受 的 语言 。 我 们 将 运用 经 典 的 “模拟 论证 
方法 来 构造 一 个 刊 定 工 的 另 一 种 多 项 式 时 间 的 算法 A′。 因 为 对 某 个 常数 k，A 能 在 
On 时 间 内 接受 L， 所 以 也 存在 一 个 常数 ec 使 A 至 多 在 工 = cnk 步 内 就 能 够 接受 直 。 对 任 
意 输 入 常 x、 算 法 A” 模拟 A 在 时 间 T 内 的 操作 状态 。 如 果 A 接受 x， 则 A/ 通 过 输出 1 拒 
绝 x。 如 果 A 没有 接受 x， 则 A “通过 输出 0 来 接受 x。A 模拟 A 的 开销 对 运行 时 间 的 影 
响 不 会 大 于 一 -个 多 项 式 因子 ， 国 此 A * 是 一 个 判定 工 的 多 项 式 时 间 的 算法 。 

注意 ， 定 理 36.2 的 证 明 过 程 是 非 构造 性 的 。 对 于 一 个 给 定 的 语言 LE P， 我 们 也 许 并 不 
知道 接受 工 的 算法 A 的 运行 时 间 界 。 但 是 ， 我 们 知道 存在 这 样 一 个 界 存在 。 因 此 , 即便 不 
能 够 轻易 地 找 出 算法 A′， 我 们 也 知道 存在 这 样 的 算法 A′ 能 够 检查 该 界 。 


36.2 多项式 时 间 的 验证 


我 们 现在 米 看 看 对 语言 成 员 进 行 “ 验 证 "的 算法 。 例 如 ， 假 定 对 判定 问题 PATH 的 一 个 
给 定 实例 《G，u，v，k>， 同 时 也 给 定 了 -一 条 从 到 v 的 路 径 p。 我 们 可 以 检查 的 长 度 是 
否 至 多 为 上 kK。 旭 果 基 的 ， 就 可 以 把 看 作 该 实例 的 确 属于 PATH 的 “证 书 "。 对 于 判定 问题 
PATH 来 说 ， 这 一 证 书 并 设 有 使 我 们 得 益 黎 少 。 毕 竟 ，PATH 属于 P- 一 事实 上 ，PATBGH 
可 以 在 线性 时 间 内 求解 一 -因此 根据 指定 的 证 书 来 验证 成 员 所 需 的 时 间 与 从 头 开 始 解决 问题 
的 时 间 一 样 地 长 。 现 在 我 们 来 考察 一 个 问题 ， 我 们 知道 它 没有 多 项 式 时 间 判 定 算法 ， 但 是 对 
于 指定 的 证 节 ， 验 证 却 是 比较 容易 的 . 


汉密尔顿 同 路 


对 找 出 无 向 图 中 的 汉密尔顿 回路 问题 已 经 进行 了 100 多 年 的 研究 。 形 式 地 说 , 无 向 图 
G=(tV,E) 中 的 -- 个 汉密尔顿 回路 是 通过 V 中 每 个 结 点 一 次 的 简单 回路 。 具 有 这 种 回路 的 图 
称 为 汉密尔顿 图 , 杏 则 称 为 非 汉 密 尔 顿 图 。Bondy 和 Murty 曾 引述 过 克 .R.Hamilton 写 的 一 
封 伪 . 信 中 摘 述 了 一 个 在 正二 二 面体 上 进行 的 数字 游戏 。 如 图 36.1(a) 所 示 , 一 个 游戏 者 在 任 
意 挨个 连续 结 点 上 钉 上 五 个 图 钉 , 另 一 个 游戏 者 必须 完成 路 径 以 形成 一 个 包含 所 有 结 点 的 回 
路 。 止 十 一 窗 体 是 汉密尔顿 图 , 图 36.1(a) 显 示 了 一 条 汉密尔顿 回路 , 十 二 面体 上 的 汉密尔顿 
阿 路 为 骨 影 近 所 示 。 但 是 , 并 非 所 有 的 图 都 是 汉密尔顿 图 。 例 好， 图 36.1(b)? 说 明了 一 个 具有 
奇数 个 结 点 的 一 分 赔 。( 练 习 36.2-2 中 将 要 求证 明 所 有 这 样 的 图 都 是 非 汉 密 尔 顿 图 。) 

我 们 可 以 用 上 下列 形式 请 言 定义 汉密尔顿 回路 问题 :* 图 'G 是 否 具有 一 条 汉密尔顿 回路 ?” 

HAM-CYCLE={《G> : G 是 一 个 汉密尔顿 图 } 

用 算法 如 何 来 羯 定语 言 HAM-~-CYCLE? 已 知 一 个 问题 实例 《G7>， 一 种 可 能 的 判定 算 
法 名 是 列 出 G 的 结 点 的 所 有 排列 , 然后 对 每 个 排列 进行 检查 , 以 确定 它 是 否 是 一 条 汉密尔顿 
回路 。 那 么 ， 该 算法 的 运行 时 间 是 多 少 呢 ? 如 果 我 们 “合理 地 "把 图 编码 为 其 邻接 第 阵 ， 图 结 
点 数 为 R(Vn )， 其 中 nmn=|《Gy》 | 是 所 的 编码 长 度 ， 总 共有 ml! 种 可 能 的 结 点 排列 ， 乓 此 算 
法 的 运行 时 间 为 Qtm) =QCVnf ) =Q(02…”)， 它 并 非 O(no 的 形式 (k 为 任意 常数 )。 
因此 这 种 朴 索 算 法 的 运行 时 间 并 非 多 项 式 时 间 ， 事 实 上， 汉密尔顿 问题 是 NP-- 完 全 的 问 


题 ， 我 们 将 在 36.5 节 中 让 明 这 一 结论 ， 





1 fb) 


沿 36.1 议 审 尔 损 凸 路 与 非 没 密 杀 顿 图 
验证 算法 


现在 米 痢 研一 个 稍为 究 易 -- 些 的 问题 。 假 设 有 个 人 说 某 给 定 图 G 是 汉密尔顿 图 ， 并 提 
岂可 通过 给 出 洛 议 密 尔 顿 回路 排列 的 结 点 来 证 明 他 的 话 。 证 明 当 然 是 非常 容易 的 : 仅仅 需要 
检 存 所 提供 的 同上 路 是 否 基 V 中 结 点 的 一 个 排列 , 以 及 沿 回路 的 每 条 连续 的 边 是 否 在 图 中 存 
在 这样 就 可 以 验证 所 提供 的 回路 是 否 是 汉密尔顿 回路 。 当 然 ， 该 验证 算法 可 以 在 Do] 
的 时 间 肉 实现， 其 中 喇 是 所 的 编码 的 长 度 。 因 此 ， 我 们 可 以 在 多 项 式 时 间 内 验证 图 中 存在 
一 条 党 和 警 尔 顿 品 路 的 证 明 过 程 。 

我 们 把 彼 壕 算法 定义 为 含 两 个 特 变 量 的 算法 A， 其 中 一 个 自 变 最 是 普通 输 人 串 x， 另 一 
个 征 称 为 "让 书 " 的 “: 进 制 串 y。 如 果 存 在 一 个 证 书 了 满足 A(x， 娘 =1， 则 该 含 两 个 自 变 量 
的 从 靶 A 验 让 了 输入 吊 x。 巾 一 -个 验证 算法 A 所 验证 的 语言 是 ， 

L=4x 0，1 六 : 存在 y5C 10，1 生 满 忠 Atx， 六 =1 

从 括 观 上 看 ， 划 果 对 任 音 帅 x L， 存 在 一 个 证 书 沁 县 A 可 以 用 y 来 证 明 xKCL， 则 算 
法 A 台 圣 证 了 启 放 直 。 上 此外， 对 任意 串 炎 工 ， 必 须 不 存在 能 证 明 xkEL 的 证 书 。 例 如 ， 在 
江 宫 水 顿 辣 路 问题 中 ， 证 书 是 弘 密 尔 顿 回路 中 结 点 的 列表 。 如 果 一 个 图 是 汉密尔顿 图 ， 则 该 
汉 党 泵 屯 问 路 本 告 就 提供 了 足够 的 信息 以 验证 这 一 事实 。 反 之 ， 如 果 一 个 图 不 是 没 密 尔 顿 
图 ， 那 么 也 木 存 在 这 样 的 结 点 列表 能 使 验证 算法 认为 该 图 是 汉密尔顿 图 ， 因 为 验证 算法 会 仔 
多 地 榈 俘 所 提供 的 "回路 "是 析 是 汉密尔顿 回路 。 


复杂 类 NP 


电灯 类 NP 足 能 被 -个 多 项 式 时 间 算 法 验证 的 语言 类 。 更 精确 地 说 ， 一 个 语言 工 属于 
NP 当世 仪 当 人 存 在 一个 帅 输 人 的 多 项 式 时 间 算 法 A 和 常数 c 满足: 
L= ix it，1 :和 存在 一 个 证 书 YI9= Ofx?)》 满 电 A(x，y) =]1} 
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我 们 说 算法 A 在 多 项 式 时 间 内 验证 了 诸 言 工 。 

根据 先前 我 们 对 汉密尔顿 同 路 问 题 的 讨论 ， 可 得 : HAM-CYCLEE NP。 此 外 ， 如 果 
L* P， 则 LNP， 因 为 如 果 存 在 一 个 多 项 式 时 间 的 算法 来 判定 L， 那 么 只 要 忽略 任何 证 
书 ， 并 接受 那些 它 确定 属于 L 的 输入 审 , 就 可 以 很 容易 地 把 该 算法 转化 为 一 个 两 自 变 量 的 验 
证 算法 。 因 此 ,了 三 NP.。 

目前 偿 不 知道 是 否 有 =NP， 但 大 多 数学 者 认为 P 和 NP 不 是 同一 类 。 直 观 上 看 ， 类 
P 由 可 以 很 快 解 决 的 阿 题 组 成 ， 而 类 NP 由 可 以 很 快 验 证 其 解 的 问题 组 成 。 从 实际 经 验 中 读 
者 也 许 已 经 知道 . 从 头 开 始 解决 一 个 问题 带 常 要 比 验证 一 个 明确 给 出 的 解 要 困难 得 多 ， 特 别 
是 入 有 时 间 限 制 的 条 件 上 下 更 是 如 此 。 从 事理 论 研 究 的 计算 机 科学 家 一 般 都 认为 这 一 类 推 可 以 
延伸 到 类 PP 和 NP 上 ， 因 此 NP 包括 了 不 属于 的 语言 。 

此 外 述 有 更 令 大 信和 服 的 证 据 能 说 明 P 和 天 NP 一 一 即 存在 “NP- 完 全 ”的 语言 。 我 们 将 在 
36.3 节 中 人 研究 这 类 语言 。 

在 P 关 NP 问题 之 外 , 述 有 许多 其 他 基本 问题 没有 解决 , 尽管 很 多 研究 人 员 做 了 大 量 的 工 
作 ， 人 组 还 没有 人 知道 NP 类 在 补 运算 下 是 知 是 封闭 的 , 亦 即 LC NP 是 否 说 明志 CE NP 的 语言 
L 的 集合 。 我们 可 以 定义 复杂 类 co-NP 为 满足 LE NP 的 语言 工 构 成 的 集合 。 这 样 一 来 ， 
NP 芋 补 运算 上 是 井 封 闭 的 问题 就 可 以 重新 表示 为 是 否 NP= co-NP。 由 于 P 在 补 送 算 下 具 
有 封 所 性 〈 见 练 二 36.1 一 7 所 以 有 PSsNP 门 co-NP。 但 是 我 们 仍然 不 知道 是 次 有 了 P= NP 仆 
co-~NP 或 在 NP 门 co-NPE-P 中 是 否 存 在 某 种 语言 。 图 36.2 说 明了 四 种 可 能 的 方案 . 


NP = co-NP 
P=NP=ceo-I 休 CF 
(1 《tp 
SS 
1 ， 


图 36.2 ”复杂 类 的 四 种 可 能 电 天 尔 








.非常 令 人 遗 憾 的 是 ， 我 们 对 了 与 NP 之 间 的 确切 关系 的 理解 是 很 不 完全 的 。 然 而 ， 通 
过 探讨 NP-- 完 全 理论 ， 从 实用 角度 来 看 ， 我 们 在 证 明 问题 是 难处 理 的 过 程 中 的 不 利 因素 也 
许 并 没有 想像 中 那么 多 ， 


36.3 NP-- 完 全 性 与 可 化 简 性 


也 许 从 事理 论 研 究 的 计算 机 学 者 相信 PN 区 的 最 令 人 信服 的 理由 是 存在 一 类 *NP_ 完 
全 -问题 。 该 类 问题 有 一 种 令 人 惊奇 的 性 质 ， 即 如 果 一 个 NP_ 充 全 问题 能 在 多 项 式 时 间 内 得 


到 靛 决 ， 那 么 NB 中 的 每 一 个 问题 都 可 以 在 劣 项 式 内 求解 ， 即 P=NP。 但 尽管 进行 了 多 年 
研究 ， 旧 有 还 泪 有 找 册 关于 任何 NP 完全 人 性 问题 的 多 项 式 时 间 的 算法 。 

次 吝 HAM-CYCLE 就 是 -个 NP- 完 全 问题 。 如 果 我 们 能 够 在 多 项 式 时 间 内 判定 
HAM-CYCLE、 就 能 够 从 过 项 式 时 间 内 求解 NP 中 的 每 一 个 问题 。 事实 上 ， 如 果 能 够 证明 
NP-P 为 非 空 集合 ， 我 们 就 可 以 肯定 地 说 AM-~-CYCLE(C NP-P. 

在 基 种 间 六 上 上 说，NP- 完 全 语言 是 NP 中 最 “ 难 * 的 语言 。 在 本 节 中 ， 我 们 将 说 明 如 何 运 
用 称 为 "多 虎 式 时 间 可 化 简 性 "的 确切 概念 来 比较 语言 的 相对 “难度 *， 首 先 ， 我 们 将 正式 定 习 
NP-- 宛 全 语言 。 然 后 我 们 简 乾 让 明 一 种 称 为 CIRCUIT-SAT 的 语言 是 NEP- 完 全 语音 。 在 
36.5 节 中 ， 我 们 将 运用 订 化 简 性 概念 来 证 明 很 多 其 他 问题 是 NP-- 完 全 问题 。 


可 化 简 性 


从 由 观 下 在， 问题 马 可 以 简化 为 问题 QQ 。 如 果 上 的 任何 实例 可 以 被 “容易 地 重新 擂 
述 为 " 马 ” 的 实 邮 ， 而 马 ” 的 实 出 的 解 也 是 只 的 实例 的 解 。 例 如 ， 求 解 天 于 未 知 量 x 的 线性 
方程 问题 可 以 转化 为 求解 二 次 方程 问题 。 已 知 一 个 实例 ax+b=0， 我 们 可 以 把 它 变换 为 
0x+ax+b=0， 其 解 也 是 方程 ax+b=0 的 解 。 因 此， 如果 一 个 问题 Q 可 转化 为 另 一 个 问题 
则 愉 某 种 意义 上 来 说 ,Q 并 不 比 驴 更 难 解决 。 

加 到 关 天 判定 问题 的 形式 语言 体系 中 ， 我 们 说 语言 L 在 多 项 式 时 间 内 可 化 简 为 语言 
L:、 扫 作 工 志 0L:， 如 果 存 在 一 个 多 项 式 时 间 可 计算 的 函数 f: 10，1 一 1，1 ,满足 对 所 
有 的 x、;0，11”， 

x、 [当世 仪 当 flx) 必 工 : (36.1) 
我 们 称 图 数 圭 为 化 舱 蚌 数 ， 计 算 工 的 项 式 时 间 算 法 称 为 化 简 算 法 ， 

图 36.3 说 明了 关于 从 语音 到 另 一 种 语言 1L， 的 才 项 式 时 间 化 简 的 转 想 。 每 一 种 语言 
上 都 证 避 ，1， 的 子 集 ， 化 简 函 数 f 提 供 了 一 个 多 项 式 时 间 的 上 映射， 使 得 春 x4 LI， 则 ffx) 导 
L.。、 划 果 x LI， 则 Rsx) 共 。 因 此 ， 化 科 函 数 担 殿 了 从 由 语言 工 | 表示 的 判定 问题 的 任意 
实 前 x 到 出 诺言 世 , 表示 的 判定 问题 的 实例 fxy 上 的 机 射 。 如 果 能 提供 是 和 否 有 xj) 〔《 工 ; 的 
算 案 也 就 笛 接 提供 了 了 是否 有 x 工 | 的 答案 。 





疼 36.3 通过 化 简 蚂 数 【 把 语言 Li 在 多 项 式 时 间 内 化 简 为 证 阁 


多 项 式 时 间 化 简 对 我 们 证 明 各 种 语言 属于 了 提供 了 -一 种 有 力 的 工具 。 
引 理 36.3 旭 果 工 ，L2E10、1 是 满足 Li 过 oL3 的 语言 ， 则 L:C P 草 合 LICP。 
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证 明 : 设 A: 起 一 个 判定 :的 多 项 式 时 间 算 法 ，F 是 计算 化 简 函 数 子 的 黎 项 式 时 间 化 简 
算法 。 我 们 构造 一 个 判定 工 ， ne Ai。 

图 36.4 说 明了 Ai 的 构造 过 程 。 对 给 定 的 输 人 xtgE {0，1} ， 算 法 A 利用 F 把 x 变换 为 
fx)， 然 后 它 利用 A, 测试 是 和 否 有 《 工 :。A: 的 输出 值 提供 给 A, 作为 输出 。 

根 瓜 条件 (36.1) 可 推导 出 A, 的 正确 性 ， 该 算法 的 运行 时 间 为 多 项 式 时 间 ， 因 为 和 
A: 的 运行 时 间 都 是 多 项 放 时 间 〈 参 见 练 习 36.1--6) 。 





图 36.4 引 理 36.3 的 证 明 


NP-- 完 全 性 


多 项 式 时 间 化 简 提 供 了 一 种 形式 方法 , 用 来 证 明 一 个 问题 在 一 个 多 项 式 时 间 因 子 内 至 少 
与 为 一 个 问题 一 样 难 。 亦 即 ， 如 果 世 和 La， 则 工 | 大 于 LL; 的 难度 不 会 超过 一 个 多 项 式 因 
子 ， 这 就 是 我 们 采用 “小 于 或 等 于 "来 表示 化 简 记 号 的 原因 。 现 在 我 们 可 以 定义 NP-- 完 全 语 
言 的 集合 ， 这 是 NP 中 最 难 的 问题 。 

语言 LE{10，1 记 是 NP- 完 全 的 , 如 果 

1. L、NP 

2. 对 每 个 LNP， 有 工 ? 

姬 果 一 种 语言 上 L 满足 性 质 2， 有 不 定 满 下 性 质 1， 则 称 世 是 NP-- 难 度 的 。 我 们 也 定 
义 NPC 为 NP- 完 全 语言 

让 如 下 列 引 理 所 述 ，NP- 完 全 性 是 判定 了 是否 等 于 NP 的 关键 。 

定理 36.4 ”如果 任 何 NP- 完 全 间 题 是 煞 项 式 时 间 可 求解 的 ， 则 了 = NP。 如 果 NEP 中 的 
任何 向 题 不 是 驳 项 式 时 间 可 求解 的 ， 则 所 有 NP-- 完 全 问题 都 不 是 才 项 式 时 间 可 求解 的 。 

证 遇 : 假定 LIL\P 并 且 L4NPC。 对 任意 工 ”《NP， 由 NP- 完 全 性 定义 中 的 性 质 2， 
我 们 有 I “和 冯 L， 这 样 就 证 明了 引 理 的 第 一 个 结论 。 

为 了 证 明 第 一 个 结论 成 立 ， 假 定 存在 一 个 LENP 满足 EL# P。 设 直 ' 《ENPC 是 任意 
NP- 宛 全 请 言 ， 为 了 引入 矛盾 假设 工 ” 和 P. 但 这 样 一 来 根据 引 理 36.3 有 工科 江 ′， 因 此 工 
、 王 . - 





谨 36.5 P、NP 和 NPC 三 者 之 间 的 关 尔 
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正 是 因为 这 个 原因 ， 对 P 关 NP 问题 的 研究 都 是 以 NP- 完 全 问题 为 中 心 的 。 大 部 分 从 事 
理论 研究 的 计算 机 学 者 都 认为 P 短 NP， 据 此 可 以 导出 图 36.5 斯 示 的 P，NP 与 NPC 之 间 的 . 
关系 。P 和 NPC 都 包含 二 NP 中 ， 并 且 P 门 NPC=9。 但 是 我 们 都 知道 ， 也 许 有 人 会 找 出 
关于 一 个 NP- 完 全 间 题 的 多 项 式 时 间 算 法 ， 这 样 就 能 证 明 P= NP. 然而 ， 由 于 迄今 为 止 还 
没有 找 册 任何 NP- 完 全 问题 的 线性 时 间 算 法 ， 所 以 目前 证 明了 一 个 问题 具有 NP-- 宛 全 性 ， 
也 就 可 以 提供 共 难 处 理性 的 极 好 证 明 。 


电路 可 满足 性 


我 们 已 经 定义 了 NP- 完 全 问题 这 一 概念 ， 但 到 现在 为 止 ， 我 们 实际 上 还 没有 证 明 任 何 
问题 是 NP- 完 全 问题 。 一 旦 我 们 证 明了 至 少 有 一 个 问题 是 NP- 完 全 性 问题 ， 我 们 就 可 以 骨 
多 项 式 时 间 可 化 简 性 作为 工具 来 证 明 其 他 问题 也 具有 NP 完全 性 。 因 些 ， 我 们 现在 者 重 证 明 
存在 一 个 NP- 完 全 问题: 即 电路 可 满足 性 问题 。 

林 幸 的 是 ， 电 路 可 满足 性 问题 的 形式 化 证 明 中 需要 一 些 超出 本 书 范围 的 技术 细节 。 因 
此 ， 我 们 将 非 正式 地 描述 一 种 基干 基本 的 布尔 组 合 电路 知识 的 证 明 过 程 ， 这 些 知 识 在 第 二 十 
刀 章 开头 我 们 已 经 论述 过 。 





针 36.6 电路 可 满足 性 问题 的 两 个 捧 语 


图 36.6 说 明了 两 个 布尔 组 合 电路 ， 每 个 电路 都 有 三 个 输入 和 一 个 输出 。 一 个 布尔 组 合 
电路 的 真 值 赋值 是 指 一 组 布尔 型 输入 值 。 如 果 一 个 单 输出 布尔 组 合 电路 具有 ~- 个 可 满足 性 赋 
仁 : 使 得 电路 的 输出 为 1 的 一 个 真 值 感 值 ， 那 么 我 们 就 说 该 布尔 组 合 电路 是 可 满足 电路 。 例 
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如 ,图 36.6 (ay 中 的 电路 具有 可 满足 性 怠 值 《xi=1，xz= 1，z2=0>， 因 此 它 是 可 满足 性 
电路 ， 不 存在 对 xi，x 和 zxa 的 赋值 使 图 36.6(b) 中 的 电路 产生 输出 为 1， 它 总 是 输出 0， 因 
此 它 是 不 可 满足 电路 。 

电路 可 满足 性 问题 就 是 :“ 给 定 一 个 由 与、 或 "和 * 非 ? 门 构成 的 一 个 布尔 组 合 电路 ， 它 
是 可 满足 性 电路 吗 ? "为 了 给 出 这 一 问题 的 形式 定义 ， 必 须 对 电路 的 编码 有 一 个 统一 的 标准 . 
我 们 可 以 设计 一 个 像 图 形 那样 的 编码 ， 使 其 可 以 把 任何 给 定 电路 C 映射 为 长 度 不 会 比 电路 


因此 ， 作 为 一 种 形式 语言 ， 我 们 可 以 定 文 : 
CIRCUIT-SAT={《C>: C 是 一 个 可 满足 的 布尔 组 合 电路 } 

电路 可 满足 性 问题 在 计算 机 辅助 王 件 优化 领域 中 极 甚 重 要。 如 果 一 个 电路 总 是 输出 0， 
就 可 以 用 一 个 省 略 所 脖 辑 门 并 提供 常数 值 0 作为 其 输出 的 简单 电路 来 取代 原 电路 。 如 果 能 
够 开发 关于 该 问题 的 多 项 式 时 间 算 法 ， 那 将 具有 很 大 的 实际 庶 用 价值 。 

给 定 一 个 电路 CC， 通过 检查 输 和 的 所 有 可 能 赋值 来 确定 它 是 否 是 可 满 足 性 电路 。 过 憾 的 
是 ， 如 果 有 k 个 输入 ， 就 会 有 2 种 可 能 的 赋值 。 当 电路 C 的 规模 为 x 的 多 项 式 时 ， 对 每 个 
电路 进行 检查 的 算法 就 是 一 个 超 多 项 式 时 间 算 法 。 事 实 上 ， 如 上 所 述 ， 我 们 有 很 强 有 力 的 证 
据说 明 不 存在 解决 电路 可 满足 性 问题 的 多 项 式 时 间 算 法 ， 因 为 电路 可 满足 性 问题 是 NP-- 完 
全 的 。 根 据 NP-- 和 完全 定义 中 的 两 个 部 分 ， 把 这 一 事实 的 证 明 过 程 也 分 为 两 部 分 。 

引 理 36.$ 电路 可 满足 性 问题 属于 NP 类 . 

证 明 : 我 们 将 提出 一 个 能 验证 CIRCUIT-SAT 的 两 输 人 的 多项式 时 间 算 法 A&。A 的 一 
个 输入 是 布尔 组 合 电路 CC 《的 标准 编码 )。 另 一 个 输入 是 一 个 相应 于 C 中 线路 一 个 布尔 型 赋 
值 的 证 书 。 

我 们 对 算法 A 构造 如 下 。 对 电路 中 的 每 个 逻辑 门 ， 它 核查 由 线路 输出 的 证 书 所 提供 的 
值 是 否 是 根据 输 人 线路 值 正 确 计 算出 的 一 个 函数 值 . 然后 ， 如 果 整 个 电路 的 输出 为 1， 则 算 
法 输出 1， 因 为 赋予 电路 C 的 输入 值 提供 了 一 个 可 满足 性 赋值 ， 否 则 ， 算 法 A 输 出 0. 

每 当 一 个 可 满足 电路 C 作为 算法 A 的 输入 时 ， 必 存在 一 个 证 书 ， 其 长 度 为 C 的 规模 的 
多 项 式 并 使 A 输出 1。 每 当 一 个 不 可 满足 电路 作为 A 的 输入 时 ， 不 存在 这 样 的 证 书 能 使 入 
认为 该 电路 是 可 满 在 的 。 算 法 A 的 运行 时 间 为 多 项 式 时 间 : 如 果 运 用 较 好 的 实现 方法 ， 本 
以 达到 线性 时 间 。 因此，CIRCUIT-SAT 可 以 在 密 项 式 时 间 央 被 验证 ， 从 而 
CIRCUIT-SATNP。 

证 明 CIRCUIT-SAT 是 NP-- 完 全 问题 的 第 二 部 分 ， 就 是 要 证 明 该 语言 是 NP 难度 的 ， 
即 我 仍 必 须 让 明 NEP 中 的 每 一 种 语言 可 以 在 多 项 式 时 间 内 化 简 为 CIRCUIT-SAT。 这 一 事 
实 的 实际 证 明 过 程 是 错综复杂 的 ， 因 此 我 们 将 基于 一 些 计算 机 硬件 的 操作 知识 给 出 一 个 简要 
的 证 明 过 程 。 

计算 机 程序 是 作为 一 个 指令 序列 存储 于 计算 机 存储 器 中 的 。 一 条 典型 的 指令 包含 操作 代 
码 、 操 作 数 在 存储 器 中 的 地 址 以 及 结果 的 存储 地 址 。 一 个 特定 的 称 为 程序 计数 器 的 存 懂 器 单 
邢 记 录 了 将 被 执行 的 下 一 条 指令 的 地 址 。 每 当 随 出 一 条 指令 时 ， 程 序 计数 器 自动 增值 ， 这 样 
就 可 以 使 计算 机 按 赎 序 执行 指令 。 但 是 ， 一 条 指令 执行 后 可 以 使 一 个 值 被 写 人 程序 计数 器 
中 、 于 是 正常 的 执行 顺序 发 生 改 变 ， 以 使 计算 机 可 以 执行 循环 或 条 件 分 支 语 句 。 

在 程序 执行 过 程 中 的 任 一 时 刻 ， 计 算 过 程 的 整个 状态 表示 于 计算 机 存储 器 中 。 (我 们 所 
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指 的 存储 器 包括 程序 自身 、 程 序 计 数 器 、 工 作 存 储 器 以 及 计算 内 务 操作 扩 设 置 的 备 种 状态 
位 .) 我 们 把 计算 机 存储 器 的 任何 一 种 特定 状态 称 为 一 个 配置 。 执 行 一 条 指令 可 以 看 作 使 一 
个 配置 映射 为 另外 一 个 配置 。 重 要 的 是 ， 实 现 这 种 映射 关系 的 计算 机 硬件 可 以 用 一 个 布尔 组 
合 电路 来 实现 ， 在 下 列 引 理 的 证 明 过 程 中 我 们 用 M 来 表示 该 布尔 组 台电 路 .。 

引 理 36.6 ”电路 可 满足 性 问题 是 NP 难度 的 。 

证 明 : 设 王 是 NP 中 的 任意 语言 。 我 们 将 摘 述 一 个 多项式 时 间 的 算法 FE 来 计 等 化 简 琴 
数 该 函数 把 等 个 一 进 制 串 x 映射 为 C=fx， 使 得 区 EC 当 且 仅 当 CECIRCUTIT-SAT. 

出 于 LE NP， 所 以 存在 一 个 算法 A 可 以 在 多 项 式 时 间 内 验证 工 。 我 们 将 构造 的 算法 F 
将 使 用 两 输入 的 算法 A 来 计算 化 简 冰 数 地 

设 TUn) 表示 算法 A 对 长 度 为 n 的 输 种 在 最 坏 情 况 下 的 运行 时 间 ，k>1 为 一 个 常数 ， 
满足 Ttn) =On') 且 证 书 的 长 度 为 Dn??。(A 的 运行 时 间 实 际 上 是 关于 整个 输入 规模 的 
一 个 多 项 式 ， 即 包括 输入 串 也 包括 证 书 ， 但 由 于 证 书 的 长 度 是 头 于 输 人 串 长 度 n 的 劣 项 
式 ， 所 以 运行 时 间 也 是 关于 n 的 多 项 式 。) 
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图 36.7 等 法 A 在 输 人 节 和 证 节 y 上 运行 所 产生 的 配置 摩 列 
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证 明 的 基本 思想 是 把 A 的 计算 过 程 表示 成 一 个 配置 序列 。 如 图 36.7 所 示 。 每 个 配置 可 
以 被 分 为 数 个 部 分 ， 包 括 A 的 程序 、 程 序 计数 器 、 辅 助 机 器 状态 、 输 入 x、 证 书 y 和 工作 
人 存储器。 从 初始 配置 cs 开始 ， 每 个 配置 ci; 都 由 实现 计算 机 硬件 的 组 合 电路 M 酉 射 到 其 随后 
的 配 病 ct。 当 算 法 A 给 止 执行 时 ， 其 输出 如 或 1) 被 写 人 工作 存储 器 的 某 个 指定 单元 ， 并 
县 如 果 我 们 假定 此 后 A 会 停止 ， 则 该 值 不 会 改变 。 因 此 ， 如 果 算 法 至 多 执行 Ttn) 步 ， 那 
么 输出 出 现 于 cr 中 的 一 位 。 四 

化 简 算 法 F 梅 造 出 一 个 组 合 电 路 ， 它 根据 给 定 的 初始 配置 计算 出 产生 的 全 部 配置 。 其 
设计 盟 想 为 复制 TD) 个 电路 M 的 拷贝 ， 并 把 它们 粘贴 在 一 起 。 产 生 配 置 e 的 第 i 个 电路 
的 输出 直接 馈送 作为 第 计 1 个 电路 的 输入 。 因 此 ， 这 些 配 置 并 非 终 止 于 一 个 状态 寄存 器 中 ， 
而 是 仅 仪 驻 岛 于 连接 M 的 拷贝 之 间 的 线路 上 。 

我 们 采 同 丰 一 下 窗 项 式 时 间 化 简 算 法 必须 做 的 工作 。 给 定 一 个 输入 x， 它 必须 计算 出 一 
个 电路 C=fx)。C 是 可 满足 电路 ， 当 且 仅 当 存 在 一 个 证 书 y 满足 A(x， 录 = 1。 当 F 获得 一 
个 输入 xx 时 ， 它 首先 计算 出 hn=x， 然 后 构造 出 一 个 由 Ta) 个 M 的 拷贝 组 成 的 组 合 电路 
CS 。C 的 输入 是 对 应 于 对 A(x, 史 进行 计算 的 初始 配置 ， 输 出 为 配置 croy。 

F 所 计算 出 的 电路 C=fx) 是 对 和 ”和 销 作 修改 而 得 到 的 。 首 先 ， 相 应 于 A 的 程序 的 C 
的 输 和 大， 初始 的 程序 计数 器 、 输 人 x 和 存储 器 的 初始 状态 的 线路 直接 与 这 些 已 知 值 相 连 。 因 
此 ， 电 路 剩 下 的 唯一 输入 对 应 于 证 书 y。 其 次 ， 电 路 的 所 有 和 输 册 都 被 和 忽略， 但 对 应 十 A 的 
输出 的 er 中 的 一 位 除外 。 这 样 构造 成 的 电路 C 对 长 度 为 Dnx) 的 件 意 输入 计算 出 Cfy) 
=Atx、y)。 当 我 们 给 化 简 算 法 下 提供 一 个 输入 串 工 时 ， 它 就 计算 出 这 样 的 一 个 电路 吧 并 输 
出。 

我 们 还 遍 证 明 两 条 人 性质， 第 一 ， 必 须 证 上 明 F 能 够 正确 地 计算 出 化 简 函 数 f， 即 必须 证 明 
C 是 可 满足 的 当 且 仅 当 存在 一 个 证 书 y 满足 Atz，? =1。 第 -- ， 必 须 证 明正 的 运行 时 间 为 
多 项 式 时 间 。 


下 Atk、y) =1。 那么 ， 如 果 我 们 把 y 的 各 位 作为 C 的 输入 ， 则 避 的 输出 为 Cl(y) =A(x， 
y) =1。 因 此 ， 如 果 有 一 个 证 书 存在 ， 则 C 是 可 满足 电路 。 另 一 方面 ， 假 定 C 是 可 满足 
的 则 对 C 存在 一 个 输入 y 满足 C(9) = 1， 据 此 我 们 得 到 A(x，y) = 1。 因此 ，EF 能 够 十 
确 地 计算 出 一 个 化 简 函 数 . 

为 了 完成 证 明 过 程 ， 仅 需 证 明 F 的 运行 时 间 是 关于 nmn= |x| 的 多 项 式 时 间 。 首 先 注 意 到 表 
示 -- 个 配置 所 需 的 位 数 是 关于 n 的 多 项 式 。A 的 程序 本 身 的 规模 为 常数 ， 与 其 输入 x 的 长 
度 无 关 。 和 输入 x 的 长 度 为 na， 证 书 y 的 长 度 为 Caax) 。 由 于 算法 至 多 运行 One) 步 ， 所 以 A 
所 要 求 的 工作 存储 器 数量 也 是 n 的 多 项 式 。 (我 们 假定 该 存储 器 单元 是 相 邻 的 ; 练习 36.3-4 
这 求 读 者 把 证 明 扩 展 到 下 列 情况 : A 所 存 取 的 存储 器 单元 散布 于 存储 器 一 个 大 范围 区 域 
肉 ， 对 每 个 输入 x 其 特定 的 散布 方式 也 可 能 不 同 .。) 

实现 计算 机 硬件 的 组 合 电路 M 的 规模 是 关于 配置 的 长 度 的 多 项 式 ， 即 为 One) 的 多 项 
式 . 可 果 也 是 关于 nm 的 多 项 式 。 电 路 C 至 多 由 t= Ong9 个 M 的 拷贝 组 成 ， 因 此 其 规模 是 基 
于 nm 的 多 项 式 。 由 于 构造 过 程 的 每 一 步 都 需要 多 项 式 时 间 ， 所 以 用 化 简 算 法 F 可 以 在 多 项 
式 时 间 内 究 成 从 x 构造 电路 C 的 过 程 。 
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综 上 所 述 ， 话 言 CIRCUIT--SAT 至 少 与 NP 中 的 任何 语言 有 同样 的 难度 ; 浆 因 为 它 属 
扩 NP， 所 以 它 基 NP-- 完 全 合 言 。 

定理 36.7 ”电路 可 注 中 性 问题 是 NEP-- 完 全 的 。 

证 了 明 : 从 引 理 36.5 和 36.6 以 及 NP 一 完全 的 定义 直接 可 推 得 结论 。 


36.4， NP-- 完 全 性 的 证 明 


电路 可 满足 性 问题 的 NP- 完 全 依赖 于 直接 证 明 对 每 一 种 语言 LC NP, 有 Ls< 
CIRCUIT-SAT。 在 本 节 中 ， 我 们 将 说 明 如 何在 不 把 NP 中 的 每 一 种 语言 直接 化 简 为 给 定 
诺言 的 前 提 下. 计 明 一 种 语言 是 NP- 完 全 的 。 我 们 将 通过 证 明 各 类 公式 可 满足 性 问题 是 
NP 一 完全 河 题 来 说 明 这 种 方法 。36.5 节 中 提供 了 更 多 实例 。 

kk 列 引 蜡 是 我 们 证 盟 一 种 语言 是 NEP-- 完 全 语言 的 方法 的 基础 。 

引 理 36.8 如 果 L 基 一 种 满足 对 某 个 工 ”&NPC， 有 LL ”到 nL 的 语言 ， 则 工 是 NP 难 
度 的 。 此 外 ， 如 果 L、NP， 则 LA NPC。 

证 了 明 : 由 于 工 ′ 是 NP- 完 全 语言 ， 所 以 对 所 有 LL”(《 NP， 我 们 有 工 ”所 I 工 ”″′。 根 据 俱 
设 、L " 科 L， 因 此 根据 传递 性 (练习 36.3-1， 我 们 有 工 ” 扫 oOL， 这 说 明 工 具有 NP 难 
度 ， 如 果 直 、NP、 同 样 也 有 EL NPC。 

换 名 话说， 通过 把 一 个 已 知 为 NP- 完 全 的 语言 工 ”转换 为 志 ， 我 们 就 可 以 把 NP 中 的 
每 一 种 语言 转换 为 直 。 因 此 ， 引 理 36.8 给 我 们 提供 了 证 明 一 种 语言 工 是 NP- 完 全 请 言 的 一 
种 方法 ; 

1. 证明 LNP。 

, 选 最 :个 已 逢 的 NP-- 完 全 语言 工 ” 

3. 撒 述 -一 种 猎 法 来 计算 一 个 国 数 志 它 把 工 ” 中 的 每 个 实例 酉 射 为 工 中 的 一 个 实例 。 
证 明 对 所 有 xf {0，1}  ， 天 数 了 满足 xE 工 ' 当 目 仅 当 fx) 发 工 。 

5. 证 明 计 算 果 数 人 的 竺 法 具有 多 项 式 运行 时 间 。 

根据 … 种 已 各 的 NP- 完 全 语言 进行 化 简 , 比 根据 NE 中 的 每 一 种 语言 提供 化 简要 简单 得 
多 .证 明了 CIRCUIT-SATK NPC 已 经 使 我 们 有 了 一 个 “* 立 是 点 ", 可 以 进一步 证 明 其 他 问 
题 是 析 是 NP- 和 完全 的 、 此 外 ， 当 我 们 列 域 已 知 的 NP-- 完 全 了 疝 题 的 目录 时 ， 运 用 这 种 方法 就 
会 容易 得 多 、 


站 


公式 可 满足 性 


在 算法 让 史上 ， 布 尔 公 式 的 可 满足 性 问题 是 最 早 被 证 明 为 P 一 完全 的 问题 。 

(公式 ) 可 满足 性 问题 可 根据 语言 SAT 描述 如 下 : SAT 的 一 个 实例 就 是 一 个 由 下 列 成 分 
组 成 的 布尔 公式 mp。 

1 布尔 型 爸 其 : Xi，Xa。，… 

2?. 布尔 连接 词 : 任何 具有 一 个 或 两 个 输入 和 一 个 输出 的 布尔 画 数 ， 如 A (与 )，WV 
(或 1， 一 ( 非 1，-=【 绚 售 1)， 估 【 当 且 仅 当 ); 

3. 插 号 。 

与 布尔 组 合 电路 中: 样 ， 关 二 布尔 公式 o 的 真 值 赋值 是 op 中 变量 所 取信 的 集合 ， 可 庄 
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足 性 赋值 是 指使 4 公式 9 的 值 为 1 的 真 信 冉 值 具有 可 满足 性 赋值 的 公式 就 是 可 满足 公式 。 
可 满足 性 问题 提出 如 下 问题 : 是 不 是 可 清 足 的 ?用 形式 语言 的 术语 有 
SAT= 《pp72 9 是 一 个 可 满足 布尔 公式 } 
例如 ， 人 么 式 
六 一 (Kx V 一 (人 ( 一 Xi xx VXD) 和 一 7 
共有 可 满足 性 赋值 《xi =0，xa 0， 妇 =1， 刀 一 1>， 这 是 因为 


p=((0>0) V 一 ( -0<1) VHD) 人 一 0 (36.2) 
= 人 (YY 一 人 1 AI1 
=(1YV0) 人 1 


=1 
因此 该 会 式 属于 SAT。 

确定 一 个 任意 的 布尔 公 趟 是 否 是 可 演 足 的 梓 素 竹 法 不 具有 多 项 区 运行 时 加 在 一 个 具有 

个 变量 的 公式 p 中 有 2" 种 可 能 的 赋值 。 如 果 《g》 的 长 度 是 关于 n 的 多 项 式 ， 则 检查 每 
一 种 可 能 的 赋值 需要 超 多 项 式 时 间 。 正 如 下 列 定理 所 述 ， 不 太 可 能 存在 多 项 式 时 间 的 算法 。 

定理 36.9 布尔 公式 的 可 满足 性 问题 是 NP-- 完 全 的 。 

证 明 : 我 们 首先 论证 SATE NP， 然 后 证 明 CIRCUIT-SAT<< ,SAT; 根据 引 理 36.8 可 
二 这 将 证 明定 理 成 立 。 

为 了 证 明 SAT 属于 NP， 我 们 来 证 明 由 对 于 输入 公式 we 的 一 个 可 满足 性 赋值 组 成 的 证 
书 可 以 在 多 项 式 时 间 内 转化 为 公式 可 满足 性 的 一 个 实例 。 我 们 可 以 运用 归纳 法 来 把 任何 布尔 
组 电路 表述 为 一 个 布尔 公式 ,我 们 仅仅 查看 产生 电路 输出 的 门 , 并 归纳 性 地 把 每 个 门 的 输 人 
表述 为 公式 。 于 大通 过 写 册 把门 表示 的 函数 作用 于 其 输 人 公式 所 产生 的 表达 式 ， 我 们 就 可 以 
获得 该 电路 的 公式 。 - 

址 把 的 是 ， 用 这 种 直接 的 方法 并 不 能 产生 一 个 多 项 式 时 间 的 化 简 过 程 。 公 共 子 式 可 能 会 
使 生成 的 公式 规模 以 指数 形式 增长 (参见 练习 36.4-1。 因 号， 从 某 种 意义 上 说 ， 我 们 必须 
采用 更 好 的 化 简 算 法 。 

图 36.8 说 明了 图 36.6(a) 中 的 电路 从 CIRCUIT-SAT 化 简 为 SAT 的 基本 思想 ， 对 
中 的 每 条 线路 xs， 公式 w 中 有 一 个 变量 x。 门 的 适当 操作 就 可 以 表述 为 关于 其 附属 线路 恋 
量 的 公式 ， 例如， 输出 "与 " 门 的 操作 为 Xioe= (xx 人 zxo)。 





图 36.8 ”把 电路 机 满足 性 化 为 公式 可 满足 性 
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由 此 化 简 算 法 产生 的 公式 史 是 电路 输出 变量 与 描述 每 个 门 的 操作 的 子 名 的 合 取 的 

“与 "。 对 图 中 的 电路 ， 相 度 的 公式 为 
四 一 XI 人 (《X4nr 一 X3) 

(xs 【xiWXo)) 
(xb 一 X4) 
(Xy< (XXX4)) 
(Xe 【XXX 
(xo<w 【XeYXI)) 
(xioe (XTAAXsA 人 Xe)) 
若 下 一 个 电路 ， 加 可 以 在 密 项 式 时 间 内 产生 这 样 的 一 个 公式 9。 

为 什么 只 有 当 公 式 w 可 满足 时 电路 C 才 是 可 满足 的 呢 ? 如 果 C 具有 一 个 可 满足 性 冉 
值 、 则 电路 的 每 条 线路 都 有 一 个 有 完备 定义 的 值 ， 并 且 电 路 的 输出 为 1。 因 此， 用 线路 的 值 
对 p 中 的 每 个 变量 赋值 后 就 使 p 中 的 每 个 子 句 的 值 为 1， 因 而 所 有 子 句 的 合 取 值 也 为 1 反 
之 ， 如 果 人 存在 一 个 赋值 g 的 值 为 1， 则 类 似 可 证 电路 C 是 可 满足 的 。 因 此 ， 我 们 已 经 说 明 
CIRCUIT-SAT 近 ,SAT， 这 样 就 完成 了 整个 证 明 过 程 。 


3-CNF 可 满足 性 


盖 >> 人 > 人 > 


根据 公式 可 满足 性 进行 化 简 ， 可 以 证 明 很 多 问题 是 NP~ 完 全 问题 。 化 简 算法 必须 能 够 
处 理 任 何 输入 公式 ， 但 这 样 一 来 我 们 就 必须 考虑 到 大 量 的 情况 。 因 此 ， 常 常 需要 根据 布尔 公 
式 的 …… 种 限制 性 语言 米 进 行 化 简 ， 以 使 需要 考虑 的 情况 较 少 。 当 然 ， 我 们 对 该 语言 的 限制 不 
会 使 其 成 为 多 项 式 时 间 可 解 的 语言 。3-CNE 可 满足 性 { 或 3-CNF-SAT) 就 是 这 样 一 种 方 
便 榴 语 理 泊 。 

我 们 运 出 上 下列 术 语 来 定义 3-CNE 可 满足 性 。 布 尔 公式 中 的 一 个 文字 是 指 一 个 变量 或 一 
个 变量 前 面 加 上 一 个 非 符号 。 如 果 一 个 布尔 公式 可 以 表示 为 所 有 子 句 的 “与 "， 且 每 个 子 句 都 
是 一 个 或 多 个 文字 的 “或 "， 则 称 该 布尔 公式 为 含 取 范 式 ， 或 CNEF。 如 果 公 式 中 每 个 子 句 恰 
好 有 三 个 不 同 的 文字 ， 购 称 该 布尔 公式 为 3 一 合 取 范 式 ， 或 3-CNF。 

例如 ， 布 尔 公式 

人 CAW 一 KRV 一 X 人 Oo 人 人 【一 YY 一 2 一 XU ) 
就 是 一 个 3- 合 皮 范 式 。 其 . :个子 名 中 的 第 一 个 为 (xiV 一 扫 Y 一 妈 )， 它 包含 三 个 文字 x， 
一 XI 和 一 X。 

在 3-CNEF-SAT 中 ， 有 这 样 的 问题 : 为 3-CNE 形式 的 一 个 给 定 布尔 公式 w 是 否 是 可 
满足 的 ? 下 鹿 定 理 说 明 即 便当 布尔 公式 表述 为 这 种 简单 范式 时 ， 也 不 可 能 存在 多 项 式 时 间 的 
算法 以 确定 其 可 满足 性 。 

定理 36.10 ”3 一 合 取 范 式 形 式 的 布尔 公式 的 可 满足 性 问题 是 NP-- 完 全 的 。 

证 明 : 由 于 3-CNE-SAT ES SAT 并 且 SATE NP， 所 以 有 3-CNFE-SATENEP 成 立 。 
因此 、 我 们 仪 需 证 明 3-CNE-SAT 具有 NP 难度 。 我 们 通过 说 明 SAT 反 ,3-CNEF-SAT 来 
证 明 结 论 、 再 由 引 理 36.8 可 知 定理 成 立 。 

化 简 算 法 可 以 分 为 “个 基本 步骤 。 每 一 步 逐 渐 使 输入 公式 9 向 所 要 求 的 3 一 合 取 范 式 接 
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第 一 步 类 似 季 在 定理 36.9 中 我 们 用 于 证 明 CERCUIT-SAT 的 过 程 。 首 先 ， 我 们 为 输入 
\ 式 构造 一 棵 -六 * 语 法 分 析 " 树 ， 文 字 作为 奎 叶 ， 连 接 词 作为 内 部 项 点。 图 36.9 说 了 明了 
起 


和 他 


一 ( (UK YY 一 (人 【一 Ke xj VX)) 入 一 xX2) (36.3) 
的 一 棵 语法 分 析 树 。 如 果 输 入 公式 中 有 包含 数 个 文字 的 “或 "的 子 句 ， 我 们 就 可 以 利用 结合 律 
对 表达 式 如 上 括号 , 以 使 在 所 产生 的 树 中 的 每 一 个 内 部 顶点 均 有 ! 或 2 个 子女 。 现 在 我 们 就 
可 以 把 一 尺 语法 分 析 树 看 作 荐 计算 该 卫 数 的 一 个 电路 。 
仿照 定理 36.9 的 证 明 中 的 化 简 过 程 ， 我 们 引入 一 个 变量 Y 作为 每 个 内 部 项 点 的 输出 。 
然后 ， 我 们 把 原始 公式 中 改写 为 根 变 量 与 描述 每 个 顶点 操作 的 子 句 的 合 取 的 “与 "公式 
436.31， 经 改写 后 所 得 的 表达 式 为 
四 ”= 一 YA (Ye (7 和 八 一 X2) 
(ys 《3Vyd)) 
(ye 《XKT 盖 X2 
(yq 一 75 
(ys (ysYx4j) 
(ye< 【一 XIer X3)) 
注意 ， 这 样 得 到 的 公式 w ”是 各 子 句 @ 7 |; 的 合 取 式 ， 每 一 个 p “至 多 有 3 个 文字 。 此 
外 唯一 的 变 求 是 每 个 了 拖 句 是 文字 的 “或 "。 


>DDD> 六 > 





苹 可. 相应 王公 起 六 一 【 长 基 1 一 w 基 2 WA 人 f《 一 其) WE Xs 其 的 树 


化 简 的 第 一 步 是 把 每 个 子 句 w ,变换 为 合 取 范 式 。 通过 对 @g ′ ; 中 变量 的 所 有 可 能 的 赋 
值 进行 让 算 ， 我 们 构造 出 pw ;的 真 值 表 。 真 值 表 中 的 每 一 行 由 子 句 变 量 的 一 种 可 能 的 赋值 
和 根据 这 -赋值 所 计算 出 的 子 句 的 值 组 成 。 如 果 运 用 真 值 表 中 值 为 0 的 项 ， 我 们 就 可 以 构造 
出 公式 的 析 取 范式 (或 DNF) 一 一 "与 "的 “或 "一 一 它 等 价 于 一 pi 然后 我 们 运用 
DeMorgan 定律 (5.23) 把 所 有 文字 取 补 并 把 “或 " 变 成 与 “与 " 变 成 "或 "就 可 以 把 该 公式 变换 
为 CNE 公式 由 
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图 36.10 子 句 (+ (9, 八 一 xaJ/ 的 真 信 表 


在 我 们 所 举 的 例子 中 ， 我 们 按 以 下 方式 把 子 杀 ”= (yn (人 mx ) 变换 为 
CNFE。 图 36.10 中 给 出 了 op ” ; 的 真 值 表 。 与 一 7 ) 等 价 的 DNE 公式 为 
(AAA 人 VON 一 TAO)JYVIGIA 一 六 人 一 和 VCmYTA 人 人 一 z) 
订 用 DeMorgan 定律 ， 得 到 CNF 公式 
钊 ”1 一 《YY 一 YY 一 2 人 【一 站 VyoV 一 和 
八 【《 一 YIVyoVYX) 人 (OOV 一 六 YX) 
它 等 价 于 原始 子 何 多 Le 

现在 会 式 % ”的 每 个 子 句 9 ”ji 已 经 被 转换 为 一 个 CNEFE 公式 9”i， 因 此 等 价 于 由 
4 ”1i 的 合 取 组 成 的 CNF 公式 @”。 此外，9 ”的 每 个 子 馈 从 移 包 依 3 个 文字 。 

化 简 的 第 三 步 ( 也 是 最 后 一 步 } 就 是 继 镍 对 公式 进行 变换 , 使 每 个 子 句 怡 好 有 三 个 不 同 的 
文字 。 最 后 的 3-CNEF 公式 % ”是 根据 CNEF 公式 9 ”的 子 句 构造 出 的 , 其 中 使 用 了 两 个 辅助 
变量 p 和 q。 对 ”中 的 每 个 子 句 Ci， 我 们 使 % 中 包 售 下 列子 句 : 

如果 CC 有 三 个 不 同 的 文字 ， 则 直接 把 Ci; 作为 pg 中 的 一 个 子 句 。 

- 如 果 Ci 中 有 两 个 不 同 的 文字 ， 即 如 果 Ci= (Na)， 其 中 和 1 为 文字 ， 则 把 (人 
vhPhvYp) 和 八 人 vLDY 一 pb) 作为 了 (9p) 的 子 铅 。 加 人 文字 p 和 一 p 仅仅 是 为 了 满足 每 个 子 
句 必须 恰 有 三 个 不 同 的 文字 这 一 语法 要 求 : 不 论 p=0 或 p=1，(0VLDYVp) 人 人 山 VLYV 一 
p) 都 等 价 于 (1 Y1)。 

-如果 Ci; 中 仅 有 一 个 文字 1， 则 把 (VpPYqy 人 (YYPY -g 人 (YY 一 pPYqj 六 1 
Y mpPY 一 g) 作为 wo" 中 的 子 句 。 注 意 p 和 q 的 每 一 种 组 合 都 使 这 四 个 子 句 的 合 取 式 的 值 
为 1。 

现在 我 们 可 以 看 出 3-CNF 公式 和 “是 可 满足 的 当 且 仅 当 上 述 三 个 步 巩 的 每 一 步 中 ，w 
是 可 满足 的 。 像 从 CIRCUIT-SAT 化 简 为 SAT 的 过 程 一 样 ， 第 一 步 根据 w 构造 ”的 过 
程 保持 可 满足 性 ， 第 二 步 产生 的 CNF 公式 p* 在 代数 上 与 p' 等 价 。 第 三 步 产 生 的 
3-CNEF 公式 go “也 等 价 于 pg”， 这 是 因为 对 变量 p 和 gq 的 任意 赋值 所 产生 的 公式 在 代数 上 
与 9 ”等 价 。 

-我们 还 必须 证 明 化 简 可 以 在 多 项 式 时 间 内 完成 。 从 9 构造 w′ 中 的 每 们 连接 词 至 多 引 
人 一 个 变量 和 -- 个 子 铝 。 从 中 ”构造 pg ”的 过 程 对 提 ” 中 的 每 一 个 子 句 至 多 在 w7” 中 引 人 8 
个 子 句 ， 这 是 因为 mw ”中 的 每 个 子 句 至 多 有 三 个 变量 ， 因 此 每 个 子 句 的 真 值 表 圣 案 有 2 =8 
行 ， 从 有 ”构造 %“ 的 过 程 对 9” 中 的 每 个 子 多 至 窗 在 4 中 引信 4 个 子 句 。 因 此 ， 所 产生 
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的 公式 w 的 规模 是 关于 原始 公式 长 度 的 多 项 式 。 我 们 可 以 容易 地 在 多 项 式 时 间 内 完成 每 一 
步 构 造 过 程 。 


36.5 “一些 NP-- 完 全 的 问题 


NP-- 完 全 问题 产生 于 各 种 领域 : 布尔 竖 辑 ， 图 论 ， 算 术 ， 网 络 设计 ， 和 集合 与 分 划 ， 存 

与 检索 ， 排 序 与 调度 ， 数 学 程序 设计 ， 代 数 与 数论 ， 趣 味 难 题 ， 自 动机 与 语言 理论 ， 程 序 
铸 等 等 。 在 本 节 中 ， 我 们 将 运用 化 简 方法 对 从 数论 到 集合 划分 的 大 量 问题 进行 NP-- 完 
全 证 明 。 

图 36.11 给 出 了 在 本 节 和 36.4 节 中 进行 药 NP- 完 全 证 明 的 结构 。 图 中 每 种 语言 的 NP_ ， 
完全 性 都 是 根据 指向 它 的 语言 的 化 简 过 程 来 证 明 的 。 其 根 为 CIRCUIT--SAT， 我 们 在 定理 
36.7 中 已 证 明了 和 亡 是 NP-- 完 全 语言 。 





VERTEX-COVER 


图 36.11 36.4 和 36.5 中 NP 完全 性 证 明 的 结构 
36.5.1 ”集团 问题 


无 向 图 G= (V，E) 中 的 集团 是 一 个 子 顶 点 集 V′ =V， 其 中 每 对 顶点 间 都 由 了 中 的 - 
一 条 边 相连 。 换 句 话 说， 一 个 集团 是 G 的 一 个 完全 子 图 。 集 团 的 规模 是 指 它 所 包含 的 顶点 
数 。 集 团 问题 是 关于 寻找 图 中 规模 最 大 的 集团 的 最 优化 问题 。 作 为 判定 问题 时 ， 我 们 仅仅 问 
这 样 一 个 问题 : 在 图 中 是 否 存在 一 个 给 定 规模 为 k 的 集团 ? 其 形式 定义 为 ; 

CLIQUE= tt《G，k>: G 是 具有 规模 为 的 集团 的 图 } 

确定 具有 {V| 个 顶点 的 图 G=(V，E) 是 否 包含 -个 规模 为 k 的 集团 的 一 种 朴素 算法 是 
列 出 V 的 所 有 k-- 下 集 。 该 算法 的 运行 时 间 为 Q(k” (") ) ， 如 果 上 为 常数 ， 则 它 是 多 项 式 
时 间 。 得 是 在 一 般 情 况 下 ，k 可 能 与 |V| 成 正比 ， 这 样 一 来 算法 的 运行 时 间 就 是 超 多 项 式 时 
间 。 因 此 ， 人 们 猜想 木 大 可 能 存在 关于 集团 问题 的 有 效 算法 ， 

定理 36.11 ”集团 问题 是 NP-- 完 全 的 。 

证 明 : 为 了 说 明 CLIQUEE NP， 对 给 定 的 图 G=(VY，E) ， 我 们 用 集团 中 顶点 集 V 
=V 作为 G 的 证 书 。 对 每 对 顶点 u，vEV 7” ， 通 过 检查 边 (u，v) 是 否 属于 忆 就 可 以 在 多 
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项 式 时 间 内 完成 对 V′ 是 否 是 集团 的 检查 。 

下 一 步 我 们 证 明 3-CNE-SAT 和 uCLIQUE， 以 此 来 说 明 集 团 问 题 是 NP 难度 的 。 从 某 
种 意义 上 来 说 ， 我 们 能 证 明 这 一 结论 是 令 人 惊奇 的 ， 因为 从 表面 上 看 膛 辑 公式 与 图 似乎 没有 
什么 联系 。 

我 们 从 3-CNF-SAT 的 一 个 实例 开始 说 明 化 简 算 法 。 设 pg= CAC 人 … 人 N 人 C 是 一 个 具 
有 kk 个子 名 的 3-CNF 形式 的 布尔 公式 。 对 5 二 1，2，…，k《， 每 个 子 句 己 怡 有 三 个 不 同 的 
文字 1 ， 1， 和 1， 。 我 们 将 构造 一 个 图 台 , 使 得 % 是 可 满足 的 当 且 仅 当 避 包 舍 一 个 规模 为 上 
的 集团 

图 台 =(V，E) 构造 如 下 ， 对 9 中 的 每 个 子 避 C, = (TVLDV1) ， 我 们 把 三 个 项 
点 Y，， v， 和 V， 组 成 的 三 元 给 放 人 V 中 。 如 果 下 列 两 个 条 件 同 时 满足 ， 我 们 就 用 一 条 边 连 
接 两 个 顶点 v; 和 vi， 

- vi 和 v; 处 于 不 同 的 三 元 组 中 ， 邯 ir 尖 8。 


- 它们 的 相应 文字 是 一 致 的 ， 即 ! 不 是 ! 的 非 。 


CC = 各 VDY 一 9 


人 一 站 Vi 





图 36.12 由 3-CNF 公式 中 =C 人 CC 导出 的 图 与 


根据 p 可 以 很 等 易 地 在 多 项 式 时 间 内 计算 出 该 图 。 我 们 举 如 下 实例 来 说 明 这 一 构造 过 
虹 ， 如 果 有 


信人 (XIVY 一 X2VY 一 KJ 人 (一 XXXVGJAAC XIO) 
刘 G 就 是 图 36.12 所 示 的 图 , 其 中 Ci= (kV 一 和 V 一 Xi CC 一 (一 XIV 2V 卫 ，C= (itV 
区 Y 其 引 。 本 
家 站 这 一 从 4 到 G 的 变换 是 一 种 化 简 过 程 。 首 先 ， 假 定 有 一 个 可 满足 性 赋 
十 ， 那 么 每 个 子 句 C, 中 至 少 有 一 个 文字 1; 被 赋值 为 1， 并 且 每 个 这 样 的 文字 对 应 于 一 个 顶 
名 Yi 。 有 从 每 个 子 句 中 挑选 出 这 样 一 个 “ 真 ” 文 字 ， 我 们 就 得 到 k 个 顶点 组 成 的 集合 Y'。 可 
以 断言 V“ 是 一 个 集团 。 对 任意 两 个 顶点  ，v'sV'r 关 习 ， 根 据 给 定 的 可 满足 性 赋值 ， 两 
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个 顶点 相应 的 文字 1 和 1 都 被 冉 什 为 1， 这 两 个 文字 不 可 能 是 互补 关系 。 因此 ， 由 司 的 构 


造 过 程 可 知 ， 边 (v，， 和 ) 属于 瑟 . 

反之 ， 假 定 G 有 一 个 规模 为 业 的 集团 V“ 。 在 台中 没有 连接 同一 个 三 元 组 中 顶点 的 
边 ， 困 此 V ' 包含 等 个 三 元 组 中 的 一 个 顶点 。 我 们 可 以 对 每 个 满足 v eV' 的 相应 文字 1; 赋值 
为 1, 不 必 担 心 出 现 对 一 个 文字 与 其 补 同 时 赋值 为 上 的 情形 ， 这 是 器 为 在 扣 中 没有 连接 不 一 
致 的 文字 的 边 。 由 于 每 个 子 句 都 是 可 满足 的 ， 所 以 9 也 是 可 满足 的 〈 不 与 集团 中 的 顶 反 相 
对 应 的 任何 变量 可 以 任意 设置 )。 | 

在 图 36.12 所 示 的 例子 中 ，p 的 一 个 可 满足 性 赋值 为 《x, =0， 刀 =0，x3:= 1>， 规 模 为 3 
的 相应 集团 由 相应 于 第 一 个 子 句 中 一 失 ， 第 二 个 子 铝 中 和 第 三 个 子 句 中 x 的 顶点 组 成 。 


36.S.2 顶点 覆盖 问题 


无 向 图 G=(V，E) 的 顶点 覆盖 是 指 子 集 VSEV, 满足 如 果 tu CE, 网 mCYV' 
或 vKV“′ (或 两 者 都 属于 V 7′ )。 亦 即 , 每 个 也 点 “覆盖 "与 其 关联 的 边 。G 的 顶点 辑 盖 是 可 
盖 E 中 所 有 边 的 顶点 组 成 的 集合 。 顶 点 覆盖 的 规模 是 指 它 所 包含 的 顶点 数目 。 例 如 ， 图 
36.13 (bj 中 的 图 有 一 个 规模 为 2 的 顶点 蓝 盖 {fw，zj。. 
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串 ! 
图 36.13 把 CLIQUE 化 简 为 V 了 ERTEX-COVER 


顶点 黎 盖 问题 是 指 在 给 定 图 中 寻找 具有 最 小 规模 的 项 点 覆盖 。 把 这 一 最 优化 问题 重新 表 
述 为 判定 问题 ， 即 确定 一 个 图 是 否 具 有 一 个 给 定 规模 丰 的 顶点 覆盖 。 作 为 一 种 语言 ， 我 们 
定义 

VERTEX-COVER=({(《G，k>， 图 G 具有 规模 为 k 的 顶点 睹 盖 }。 

下 面 的 定理 说 明 该 问题 是 NP- 完 全 问题 ， 

定理 36.12 ”顶点 覆盖 问题 是 NE 一 完全 的 。 

证 明 : 我 作 先 来 说 明 VERTEX-COVERE NP。 人 假定 已 知 一 个 图 后 =(V，E) 和 整数 
k。 我 们 选取 的 证 书 是 顶点 覆盖 VSV 自身 。 验 证 算法 证 实 |V ”|1=， 然 后 对 每 条 边 人 ， 
v 坟 下 上， 检查 是 否 有 ukEYV -或 vEV7” 。 我 们 可 以 简单 地 在 多 项 式 时 间 内 进行 这 一 验证 。 

我 们 通过 说 明 CLIQUE 和 ,VERTEX 一 COVER 来 证 明 项 点 覆盖 问题 是 NP 难度 的 。 


这 一 化 简 过 程 是 以 图 的 “ 补 图 * 概念 为 基础 的 。 已 知 一 个 无 向 图 G = (V，E) ， 我 们 定 
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义 扣 的 补 转 为 G = (V，E) ， 其 中 {E = (u，v) : (ua，v) #E}。 换 句 话说 ， 扎 是 包含 不 
在 台中 的 那些 边 的 图 。 图 36.13 显示 了 一 个 图 与 其 补 图 ， 并 说 明了 从 CLIQOUE 
到 VERTEX 一 COVER 的 化 简 过 程 。 

化 简 算 法 的 输 和 人 是 集团 问题 的 实例 《4G，k>。 它 计算 出 补 图 各， 这 很 容易 在 多 项 式 时 间 
内 究 成 。 化 简 算 法 的 输出 基 顶 点 覆盖 问题 的 实例 《G， 人 |V| 一 k>。 为 了 完成 证 明 ， 我 们 来 说 
明 该 变换 的 确 起 一 个 化 简 过 程 : 图 各 具有 一 个 规模 为 k 的 集团 当 且 仅 当 图 扣 有 一 个 规模 
为 IVj =-K 的 顶点 团 盖 ， 

根 设 G 包含 一 个 集团 兴 EV， 且 |V1=k。 我 们 断言 一 Y" 是 后 中 的 一 个 顶点 覆盖 ， 
设 (au，v) 是 E 中 的 任意 边 , 则 有 (u，v) #E， 这 说 明 u 或 v 台 少 有 一 个 不 属于 V， 因 
为 W 中 的 每 对 硕 点 税 都 有 一 条 眉 中 的 边 相 连 。 

等 价 地 ，u 或 vv 至少 有 一 个 属于 V 一 Y， 这 意味 着 边 〈《u，v)] 被 Y 一 V 所 杆 盖 。 由 
和 (u，v) 是 从 E 中 任意 选取 的 边 ， 所 以 互 的 每 条 边 都 被 V 一 V' 中 一 个 顶点 所 覆 善 。 因 
此 ， 规 模 为 jV| 一 k 的 集合 V 一 V: 形 成 了 所 的 一 个 顶点 覆 善 ， 

之 假设 G 具有 一 个 顶点 覆盖 V' 三 V， 其 中 Y=4IVI 一 kk。 那么 ， 对 所 有 Tu，veV， 

如 果 tu，v) <eE， 则 ueV' 或 veV' 或 两 者 都 成 立 。 与 此 相对 就 有 对 所 有 u，veV， 如 果 
EV 且 vsV ， 则 有 (u，v) sE。 换 句 话 说 ，V 一 YV 是 一 个 集团 ， 其 规模 为 4 一 |V41 = 不。 

由 于 VERTEX-COVER 是 NP- 完 全 的 ， 所 以 我 们 并 不 期 望 能 找 出 一 种 多 项 式 时 间 的 
算法 来 寻找 最 小 规模 的 顶点 覆盖 。 不 过 ，37.1 节 中 阐述 了 一 种 多 项 式 时 间 的 * 才 近 算法 ”， 
它 可 以 产生 顶点 绅 盖 问题 的 “近似 " 解 。 该 算法 所 产生 的 顶点 覆盖 的 规模 至 多 为 顶点 覆盖 最 小 
规模 的 两 倍 。 

寻找 最 优 解 虽然 是 NEP- 完 全 问题 ， 但 依然 可 能 存在 某 种 多 项 式 时 间 的 遂 近 算法 , 使 我 们 
可 以 获得 近 最 优 的 解 。 因 此 ， 我 们 不 能 仅 因 为 某 个 问题 是 NP-- 完 全 的 就 放弃 希望 。 第 三 十 
七 章 介绍 了 几 个 关于 NP- 完 全 问题 的 逼近 算法 .。 


36.5.3 子 集 和 问题 


我 们 要 考虑 的 下 一 个 NP- 完 全 问题 是 一 个 算术 问题 , 即 子 集 和 问题 。 在 子 集 和 问题 中 ， 
已 知 一 个 有 限 集 SS N 和 一 个 目标 tE N。 我 们 回 是 否 存 在 这 样 一 个 子 集 83” 三 S， 其 元 素 和 
为 t， 例 如 ， 如 果 S= 人 11，4，16，6 的 ，2S6，1040，1041，1093，1284，1344}，{t=3754， 
则 了 集 S ”= 11，16，64，256，1040，1093，1284} 就 是 该 问题 的 一 个 解 。 

和 通常 一 样 ， 我 们 把 该 问题 定义 为 语言 : 

SUBSET-SUM={《S，ft>: 存在 一 个 子 集 $S” 三 8$, 满足 t=Zcs,S} 

与 任何 算术 问题 一 样 ， 重 要 的 是 记 住 在 我 们 的 标准 编码 中 假定 输 人 整数 都 是 二 进 制 代 
码 。 在 这 个 假设 下 ， 我 们 可 以 证 明 对 于 了 集 和 问题 不 大 可 能 存在 一 种 快速 的 算法 。 

定理 36.13 ” 子 集 和 问题 是 NP- 完 全 的 ， 

证 明 : 为 了 说 明 SUBSET-SUM 属于 NP， 对 该 问题 的 实例 《S，t?， 我 们 设 子 集 S 
是 证 书 。 用 一 种 验证 算法 就 可 以 在 多 项 式 时 间 内 完成 对 是 否 t= 王 ,cs'S 的 检查 。 

现在 我 们 来 证 明 VERTEX-COVER<SUBSET-SUM。 给 定 一 个 顶点 履 盖 问题 的 实 
例 ， 化 简 算 法 构造 出 子 集 和 问题 的 实例 《s，t>， 满 足 G 是 具有 一 个 规模 为 k 的 顶点 覆 羡 当 
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且 仅 当 存 在 S 的 一 个 子 集 ， 其 和 恰好 为 t。 
化 御 算 法 的 核心 是 台 的 关联 矩阵 表示 。 设 台 =(VY，E) 是 一 个 无 向 图 ， 并 设 V- {vo， 
wW，……，Vvrj，E={eo，b，…，eg- 直 。 台 的 关联 矩阵 是 一 个 [YIx | 虞 | 的 抢 阵 了 = (bi) ， 满 











1 如 果 边 e 与 顶点 v 相关 联 
0 否则 > 本 了 和 到 全 
3 JS IE 二 吧 所 并 让 和 
TI 
人 下 了 下 于 mm 和 让 EL 帮 EELTEETEEE ET 二 
吗 \ 上 上 于 于 直 Ta 
和 1 量 ” 
IN 
一 一 卡 人 
m 本 1 二 
2 -三 局 ? 
汪汪 ] 人 :二 和 在 下 | 
0 1D) 人 可 WALL REDERSSEE 
23 ”人 
3 呈 必 有 
二 IDDODOD = .3 





几 36.14 ”把 结 点 覆 羔 癌 题 化 简 为 子 集 和 问题 


例如 ， 图 36.14(b) 说 明了 图 36.14(a) 中 无 拘 图 的 关联 抠 阵 。 我 们 在 关联 矩阵 中 把 下 标 
较 小 的 边 艾 在 有 边 ， 面 不 是 像 通常 那样 放 在 左边 ， 这 主要 是 为 了 方便 对 关于 S 中 数 的 公式 
的 简化 . 

给 定 一 个 图 G 和 -个 整数 k， 化 简 算 法 算出 一 个 数 的 集 3 和 一 个 整数 t。 为 了 弄 清 化 简 
算法 的 计算 过 程 ， 我 们 力 一 种 “改进 的 基数 为 4" 的 方法 来 表示 数 。 一 个 数 的 巴 | 个 低位 数字 采 
用 基数 为 4 表 和 所 ， 但 商 位 数字 可 能 大 到 X。 我 们 用 这 样 的 方法 来 构造 数 的 集合 ， 即 不 能 将 进 
位 从 低位 向 高 位 传递 。 

集合 $ 由 晤 种 类 型 的 数组 成 ， 分 别 对 应 于 顶点 和 边 。 对 每 个 顶点 vi& V， 我 们 建立 一 个 
正 整 数 扫 ， 其 改进 的 基数 为 4 的 表示 由 1 和 跟随 菱 后 的 王 个 数位 组 成 。 如 图 36.14(c) 所 
示 ， 人 B=(bi) 的 第 w 行 ， 形 式 节 ， 对 ii=0，1，…，vFI1， 有 

X， 一 4 十 互 hb， 4 


对 每 条 边 a E， 我 们 构造 一 个 正 整数 yi， 人 《单位 关联 第 阵 
是 一 个 IBJx 丰 j 息 阵 , 且 只 有 对 角 线 上 的 元 素 为 1.)》 形式 地 ， 对 j=0，1，…， 司 |-1， 有 有 
Wi 一 4 
目标 和 (ft 的 第 一 个 数位 是 k， 并 且 所 有 |EI 个 低位 数位 都 是 2。 形式 地 : 
t=k4 十 和 2.4| 


一 
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所 有 这 些 数 表示 成 一 进 制 数 时 都 具有 多 项 式 规模 。 通 过 控制 关联 矩阵 中 的 数位 ， 我 们 
可 以 在 多 项 式 时 间 内 执行 化 简 过 程 。 

现在 我 们 必须 证 明 : 图 G 具有 一 个 规模 为 的 顶点 覆盖 , 当 且 仅 当 存 在 一 个 子 集 S' E 8， 
县 其 和 为 t。 首先 ， 假 定 忆 中 有 一 个 规模 为 kx 的 顶点 覆盖 V ESsYVY。 设 V 
一 tw Vi vi 让 并 定义 号 为 

s=fx ， Xi xi 
{y， : e 恰好 与 V' 中 的 一 个 顶点 关联 } 

为 了 说 明了,。,S = t， 请 注意 到 把 x，eS' 的 前 K 个 1 相 加 就 得 到 1 的 改进 的 基数 为 4 表 
示 中 的 前 第 k 位 数位 。 为 了 得 到 + 的 低位 数位 (每 一 位 都 是 2) ， 依 次 考察 各 数位 ， 每 一 个 
数位 对 应 于 一 条 边 。 。 因 为 V' 是 一 个 顶点 团 盖 ， 所 以 。 至 少 与 V' 中 的 一 个 顶点 相关 联 。 
因此 ， 对 每 条 边 e ， 至 少 有 一 个 Ki <S' 满足 其 第 j 个 位 置 上 是 1， 如 果 e; 与 V' 中 的 两 个 顶 
点 相关 联 ， 则 两 者 都 对 第 j 个 位 置 没有 影响 ， 因 为 ej 与 两 个 顶点 相关 联 就 说 明 yj#S'， 因 
此 ， 达 种 情况 下 ，S' 的 和 在 + 的 第 j 个 位 置 上 产生 一 个 2， 对 另外 一 种 情况 (e 人 恰好 与 V 中 
的 一 个 顶点 关联 时 ) 我 们 有 y sS'， 所 以 关联 顶点 和 y 均 对 上 的 第 j 个 数位 加 1， 因 此 也 产 
生 一 个 2。 因此 ，S' 是 子 集 和 实例 $ 的 一 个 解 。 

现在 ,假设 存在 -- 个 和 为 t 的 子 集 S' 皇 S。 设 S = fx WU， 7 } 
我 们 斯 言 思 = 上 并 且 V = {v ，v ，…，V } 是 G 的 一 个 顶点 覆盖 。 为 了 证 明 该 断言 成 
z*， 我 们 首先 注意 到 对 每 条 边 eeE， 集 合 S 在 e 位 置 上 有 三 个 1: 两 个 来 自 于 与 e 关联 的 
两 个 顶点， 一 个 来 自 于 y  。 因 为 我 们 采用 的 是 改进 的 基数 为 4 的 表示 法 ， 所 以 从 位 置 e， 
到 e。 ,， 没有 进位 。 因 此 对 t 的 旧 | 个 低位 位 置 中 的 每 一 个 位 置 ， 至 少 有 1 个 、 至 多 有 两 个 x 
必定 对 和 有 影响 。 因 为 对 每 条 边 至 少 有 一 个 x 对 和 有 影响 ， 所 以 我 们 可 以 看 出 V 是 -- 个 项 
点 覆盖 。 为 了 说 明 m =k， 因 而 V' 是 一 个 规模 为 k 的 顶点 覆盖 注意， 获得 目标 t 中 前 面 
的 X 的 唯一 方法 是 在 和 中 恰好 包括 个 xi。 

在 图 36.14 中 ， 顶 点 覆盖 V = {v  ，v, ，v 对 庶 于 子 集 8 
= ti xi，X4，y0，y7，3，y4 小 。 除 了 y, 以 外 ， 所 有 的 y| 都 包含 在 S 中 ， 这 是 由 为 3 
与 V' 中 的 欺 个 顶点 相关 联 。 


36.5.4 ” 汉 密 尔 师 回路 问题 


现在 我 们 回头 来 讨论 第 36.2 节 中 定义 的 汉密尔顿 回路 问题 。 

定理 36.14 汉 窗 尔 顿 回路 问题 是 NE- 完 全 的 。 

证 明 : 我 们 先 说 明 HAM-CYCLE 属于 NP。 已 知 一 个 图 G=(V，E)， 我 们 选取 的 证 
书 是 形成 汉密尔顿 回路 的 | 个 顶点 组 成 的 序列 。 验 证 算法 检查 这 一 序列 恰好 包含 V 中 每 个 ， 
顶点 一 次 〔〈 只 有 第 一 个 顶点 在 末尾 重复 出 现 一 次 )， 并 且 它 们 在 台 中 形成 一 个 回路 。 该 验证 
算法 可 以 在 多 项 式 时 间 内 执行 。 
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图 36,15 了 附 必 尿 | 几 庆 站 直人 征 与 入 孙 


现在 我 们 通过 说 明 3-~CNEF-SAT< 和 ,HAM~-CYCLE 来 证 明 HAM-~CYCLE 是 NE- 完 
全 的 。 给 定 一 个 关于 变量 za，z，…，z 的 3-CNEF 布尔 公式 ， 它 由 子 句 Cj，C2，…，C， 
构成 、 每 个 子 句 恰好 包含 3 个 不 同 的 文字 、 我 们 在 多 项 式 时 间 内 构造 一 个 图 G=(V，B) ， 
使 得 G 具有 一 个 汉密尔顿 回路 当 且 仅 当 多 是 可 满足 的 。 构 造 的 基础 是 附件 图 ， 它 是 具有 某 
种 特定 性 质 的 图 

我 们 的 第 一 个 附件 图 是 图 36.15(a) 所 示 的 子 图 A。 假 定 A 是 某 个 图 G 的 子 图 , 并且 A 
与 G 的 其 余部 分 仅 通过 顶点 a，a′，b 和 b ” 相连。 此 外 ， 假 定 图 @ 具有 -个 汉密尔顿 回 
路 ， 由 于 G 的 任何 汉密尔顿 回路 都 必须 以 图 36.15(b) 和 (c]) 所 示 的 两 种 方式 中 的 一 种 经 过 
硕 点 a，z 五 和 3， 所 以 我 位 可 以 把 子 图 A 看 作 似乎 仅 有 两 条 边 (a，a′ 》 和 (b， 
b“ )， 而 且 台 的 任何 汉密尔顿 回路 都 必须 包含 这 两 条 中 的 一 条 。 我 们 将 用 36.15(d) 中 的 形 
式 来 表示 附件 图 A. 

36.16 中 的 子 图 B 是 我 们 的 第 二 个 附件 图 。 假 定 B 是 某 图 G 的 一 个 子 图 ，B 与 G 的 
其 余部 分 仅 通过 顶点 bj，bz，bs 和 bs 相连 接 . 图 G 的 一 个 汉密尔顿 名 路 不 可 能 同时 经 过 边 
tb,，b:) ，《b:，b3) 和 《bj，ba)， 这 是 因为 这 样 一 来 附件 图 中 除 bj，P2，bi 和 by 以 外 的 所 
有 顶点 都 将 不 会 被 经 过 。 不 过 ，G 的 一 个 汉密尔顿 回路 可 以 经 过 这 些 边 的 任何 一 个 真子 
集 ， 图 36.16(a) -(e) 说 明了 五 个 这 样 的 子 集 , 通过 对 (b) 部 分 和 (e) 部 分 进行 上 下 对 称 项 
点 交换 就 可 以 得 到 其 余 的 两 个 子 集 ， 我 们 将 用 图 36.16 (中 的 形式 来 表示 附件 图 B， 其 思 
握 是 汉密尔顿 回路 必须 至 少 包含 一 条 箭头 所 指 的 路 径 。 

我 们 将 构造 的 图 G 大 部 分 都 宙 这 两 个 附件 图 的 拷贝 所 构成 。 构 造 过 程 如 图 36.17 所 
KK， 对 9 中 芷 个子 句 中 的 每 一 个 ， 我 们 加 入 附件 图 B 的 一 个 拷贝 ， 并 且 把 这 些 附 件 图 按 如 
下 方式 顺序 地 连接 在 一 起 。 设 bi 是 附件 图 B 的 第 i 个 搬 忠 中 相应 于 b 的 拷贝 ， 我 们 把 bi 
与 1 ; 相连 ，i= 1，2，…，k 一 1。 
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图 36.15 了 件 图 了 B 此 其 卉 嫩 、 


然后 ， 对 史 中 的 每 个 变量 xm， 我 们 在 图 中 放 和 两 个 项 点 xm 和 xx?”i, 并 且 通 过 边 
tm xm) 的 两 个 拷贝 把 这 两 个 顶点 相连 。 为 了 区 别 ， 我 们 分 别 用 所 和 5 来 表示 这 两 
杀 按 。 其 思想 是 如 果 汉 密 尔 顿 回路 包含 边 E ， 就 相当 于 对 变量 zw 赋值 为 1。 如 果 汉 密 尔 顿 
回路 包含 边 en， 就 相当 寺 对 变量 x 赋值 为 0。 这 些 边 中 的 每 一 对 都 形成 一 个 两 条 边 的 回路 ， 
通过 加 和 边 (xm x”a4l) 再 把 这 些小 回路 按 顺 序 连接 起 来 ，m= 1，2，…，n-1。 我 们 
用 两 条 廊 (bt :， x  ) 和 (be 4， xx” 把 图 的 左 (〈 子 句 ) 边 与 右 〈 变 量 ) 边 连接 起 来 ， 
如 图 36.17 中 所 示 的 最 上 面 一 条 边 和 最 下 面 一 条 边 。 





图 386.17 根据 公式 全 一 人 下 一 AR 下 VD xj 档 造 出 的 入 二 3 


现在 我 们 述 没有 完成 图 G 的 构造 过 程 ， 因 为 我 们 还 必须 把 变量 与 子 句 联系 起 来 。 如 果 
于 名 《Ci 的 第 j 个 文字 是 xs， 则 我 们 用 附件 图 A 使 边 〈bi，b，i) 和 边 eu 相连 接 。 如 果子 
名 Ci 的 第 j 个 文字 是 一 xm， 则 我 们 就 用 附件 图 A 使 边 【bs，bi, ii) 与 边 E_ 相连 接 。 例 
如 ，、 在 图 36.17 中 ， 氏 为 子 名 C, 是 (xiY 一 妈 YVx)， 所 以 按 如 下 方式 加 入 三 个 附件 图 A: 

在 (b、,，b，,) 与 e 之 间 

-在 (b: :，b: ) 与 s, 之 间 

-在 〈b、:，b: 4 与 e; 之 间 

注意 ， 如 果 用 附件 图 A 来 连接 两 条 边 , 实际 上 需要 把 每 条 边 置换 为 图 36.15 (a) 中 最 
上 面 或 最 下 面 的 蕊 条 边 ， 当 然 ， 同 时 还 要 加 入 通过 z 顶点 的 边 。 由 于 一 个 给 定 的 文字 1 可 
能 出 现在 数 个 子 句 中 (例如 图 36.17 中 的 一 x3) ， 因 此 一 条 边 e。 或 s。 可 能 受到 数 个 附件 
图 A 的 影响 〈 例 如 过 E,) 。 在 这 种 情况 下 ， 我 们 把 附件 图 A 连接 成 一 个 序列 ， 如 图 36.18 
所 未 、 放 用 一 个 进 的 序列 来 代替 边 e 或 E 。 (ce) 图 36.17 的 部 分 。 (5) 实际 构造 的 子 


图 ， 
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(a) 
图 36.18 ” 当 一 条 边 eu 或 E， 受 数 个 附件 转 A 影响 时 的 实际 构造 过 程 





我 们 断言 公式 op 是 可 满足 的 当 且 仅 当 图 G 包含 一 个 汉密尔顿 回路 。 先 假设 G 具有 一 个 
汉 密 顿 回路 h， 并 证 明 p 是 可 汪 足 的 。 回 路 h 必定 具有 一 种 特定 形式 : 

- 首先 ， 它 经 过 边 (bl ,， x ”0 从 项 部 左边 到 达 顶 部 的 右边 。 

-然后 选取 边 en 和 su 中 的 一 条 (但 不 能 同时 选取 两 条 边 ) 自 项 向 下 经 过 所 有 的 x 
和 x”。。 
-下 一 步 经 过 边 〈bk 4，x 7” 。) 又 回 到 左边 。 

最 后 它 经 过 左边 各 个 B 附件 图 从 底部 回 到 顶部 。 
( 它 实 际 上 也 经 过 A 附件 图 内 部 的 边 ， 但 我 们 利用 这 些 子 图 来 表示 它们 连接 只 有 -条 出 现在 
汉密尔顿 同 路 中 .。 ) 

已 知 汉 审 尔 顿 回路 h， 定 义 9 的 真 值 研 值 如 下 。 如 果 边 em 属于 h， 则 置 xr=]1 否则 ，en 
属于 h， 置 x =0。 

我 们 断言 这 一 赋值 可 满足 p。 考 罕 子 句 Ci 和 其 在 G 中 相应 的 附件 图 B。 和 根据 子 句 中 第 
j 个 文字 是 xn 还 是 “xm， 我 们 用 附件 图 A 使 边 《bi bi hn 与 边 em 或 者 边 5。 相连 。h 
经 过 边 〈b' ij，bi rnD 当 且 仅 当 相应 的 文字 为 0。 因 为 子 句 Ci 中 的 三 条 边 〈b，;，b' )， 
tb >， ,ba 和 (by，b 也 都 在 一 个 附件 图 B 中 ， 所 以 汉密尔顿 回路 h 不 可 能 经 过 所 
有 这 三 条 边 。 因此， 三 条 边 中 必 有 一 条 边 其 相应 的 文字 被 赋值 为 1， 这 样子 句 Ci 被 注 足 . 
这 一 人 性 质 对 每 个 子 句 Ci 《Gi= 1，2，…，k) 者 成立， 因此 就 可 以 满足 公式 p。 

反之 ， 我 们 假设 公式 w 被 某 个 真 值 赋 值 所 满足 。 根 据 上 述 的 规则 ， 我 们 可 以 为 图 G 构 
造 出 一 个 汉密尔顿 回路 : 如 果 xm 一 1， 则 回路 经 过 边 es， 如 果 xn 一 0， 则 回路 经 过 边 E ，， 
同 路 经 过 边 (bi ij，bi, im) 当 且 仅 当 在 该 由 值 下 ， 子 句 Ci 的 第 j 个 文字 为 0。 由 于 我 们 假定 
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5 第 公式 op 的 一 个 可 满足 性 赋值 ， 所 以 我 们 的 确 可 以 遵循 这 些 规 则 ， 

最 后 ， 我 们 指明 可 以 在 多 项 式 时 间 内 构造 出 图 G。 对 @ 中 k 个子 句 中 的 每 一 个 ， 图 中 
都 有 -一 个 附件 图 B。p 中 每 个 文字 的 每 个 实例 存在 一 个 附件 图 A， 所 以 共有 3 个 附件 图 
A。 由 于 附件 图 A 的 B 都 具有 固定 的 规模 ， 所 以 图 G 和 包含 O(k) 的 顶点 和 边 ， 容 易 在 多 项 
式 针 间 内 构造 出 来 。 至 此 ， 我 们 就 给 出 了 有 3-CNF-SAT 到 HAM-CYCLE 的 一 个 允 项 式 
时 间 的 化 简 算 法 。 


36.5$.$ ” 货 郎 担 问题 


货 郎 担 问题 号 汉 密 尔 字 路 问题 有 着 密切 的 联系 . 在 该 问题 中 ， 一 个 华 货 员 必 须 访 问 n 
个 城市 。 如 果 把 该 问题 模型 化 为 一 个 具有 j 个 顶点 的 完全 图 ， 我 们 就 可 以 说 这 个 售货员 希 
月 进行 一 次 六 册 旅 行 ， 或 经 过 汉密尔顿 回路 ， 恰 好 访问 每 个 城市 一 次 , 并 最 终 回 到 出 发 的 城 
市 ， 从 城市 1 到 城市 j 的 旅行 费用 为 一 个 整数 c (i， 和 ， 这 个 售货员 希望 钝 整个 旅行 的 费 证 
报 低 . 而 央 需 的 全 部 费用 是 他 旅行 所 经 过 的 各 边 费 用 的 和 。 例 如 ， 在 图 36.19 中 ， 费 用 最 低 
的 旅行 路 线 (用 阴影 绪 盖 的 边 表示 ) 是 《u，w， v，x，U2， 其 费用 为 7。 关 于 货 郎 担 问 题 的 形 
式 培 诗 是 : ， 

TSP={《G，c，k>》 : G= (【V，E) 是 一 个 完全 图 ， 

c 是 在 Vx V-=~Z 上 的 函数 ， 

KKC Z 并 且 

避 包 含 一 个 费用 至 驳 为 k 的 货 郎 担 的 旅行 回路 } 
. 码 





图 36.19 货 郎 担 问 题 的 一 个 例子 


下 笛 的 定理 说 明 不 大 可 能 存在 一 种 关于 货 郎 担 问题 的 快速 算法 。 
定理 36.15 ” 货 郎 担 问 题 是 NP-- 完 全 的 。 
证 明 : 我 们 先 来 说 明 TSP 属于 NP。 给 定 该 问题 的 一 个 实例 ， 我 们 用 回路 中 个 顶点 
组 成 的 序列 作为 证 书 。 验 证 算法 检查 该 序列 是 否 恰好 包含 每 个 顶点 一 次 ， 并 且 对 边 的 费用 求 
和 后 检查 和 是 和 否 全 多 为 k。 当然 ， 可 以 在 多 项 式 时间 内 完成 这 一 过 程 。 
为 了 让 明 TSP 是 NP 难度 的 ， 我 们 说 明 HAM-CYCLE< ,TSP。 设 G=Cv， E) 是 
HAM-CYCLE 的 一 个 实例 。 构 造 TSP 的 实例 如 下 。 建 立 一 个 完全 图 台 '′ =(V，E7* )， 其 
E = 一 0 :ii V， 征 义 费 用 末 数 ec 为 ; 
cj -人 如 果 [i， 廊 EE 
1 如果 (i， 门 KE 
于 是 《G ”，c，0》 就 是 TSP 的 实例 ， 很 容易 在 多 项 式 时 间 内 产生 这 样 的 实例 .， 
现在 米 说 明 图 G 具有 一 个 汉密尔顿 回路 当 且 仅 当 图 G′ 有 一 个 费用 至 多 为 0 的 回路 . 
假定 网 G 中 有 -个 汉密尔顿 回路 h。h 中 的 每 条 边 都 属于 下 ， 因 此 在 G 7 中 的 费用 为 0。 因 


此 ，h 在 G' 中 是 费 用 为 0 的 加 路。 反之， 假定 图 G′ 中 有 一 个 费用 至 多 为 0 回路 。 由 于 
E* 中 边 的 费用 只 能 是 0 或 1、 所 以 回路 7 的 费用 就 是 0。 因 此 ，h ′ 仅 包含 卫 中 的 边 . 这 
祥 我 们 就 得 出 结论 ，h 是 图 G 中 的 一 个 汉密尔顿 回路 。 


-思考 题 


3 拓 -1 独立 集 


图 G={(V，E) 的 独立 集 是 子 集 V′EV， 使 得 E 中 的 每 条 过 至 多 与 V 7 中 的 一 个 头 点 
相关 联 。 独 立 集 问题 是 要 找 出 G 中 具有 最 大 规模 的 独立 集 。 

a. 给 出 与 独立 集 问题 相关 的 判定 问题 的 形式 描述 , 并 证 明 它 是 NP- 完 全 的 。 ( 提 示 : 根 
据 集 团 问题 进行 化 简 ) 

b. 假 设 现 有 一 个 在 (a) 中 定义 的 判定 问题 的 子 程序 。 试 写 出 一 个 算法 以 找 出 规模 最 大 
的 独立 集 。 所 给 出 的 算法 的 运行 时 间 应 该 是 关于 |Vj 和 氏 | 的 多 项 式 ， 其 中 查询 黑箱 的 工作 被 
看 作 一 步 操作 . 

”尽管 独立 集 问题 是 NP-- 完 全 的 ， 但 在 特殊 情况 下 ， 该 问题 在 多 项 式 时 间 内 可 求解 。 

c. 当 G 中 的 每 个 顶点 度数 均 为 2 时 ， 试 写 出 一 有 效 算 法 以 求解 独立 集 问题 。 分 析 算法 
的 运行 时 间 并 证 明 算 法 的 正确 人 性 

d. 当 G 为 二 分 图 时 ， 试 写 出 一 有 效 算 法 以 求解 独立 集 问题 分 析 算 法 的 运行 时 间 并 证 
明 算 法 的 正确 性 。 (提示 : 利用 第 27.3 节 中 的 结论 ) 


36-2 图 的 着 色 


无 向 网 G=(V，BE) 的 -着 色 是 晤 数 c: V 也 2，…，kj， 并 汪 足 对 每 条 边 《ua， 
v) 、E， 有 cftu) 扼 ctv)。 换 名 话说 ， 数 1，2，…, 上 表示 上 种 颜色 ， 并 且 相 邻 顶 点 必须 为 
人 本 的 着 色 问题 是 确定 要 对 某 个 给 定 和 着 色 所 上 四 的 最 少 的 色 和 类 

写 出 一 有 效 算 法 以 找 出 一 个 图 的 2 一 着 色 【如果 存在 的 话 )。 

把 图 的 着 色 问 题 描述 为 _ 个 判定 问题 证 明 : 该 判定 问题 在 多 项 式 时 间 内 可 求解 当 且 
仅 当 图 的 着 色 问 题 在 多 项 式 时 间 容 可 求解 。 

c. 设 语言 3-COLOR 是 能 够 进行 三 着 色 的 图 的 集合 。 延明 : 如 果 3-COLOR 是 NP-- 完 
全 谨 言 ， 则 在 人 bj) 中 的 判定 问题 是 NE 一 完全 的 。 

为 了 证 明 3-COLOR 具有 NE 一 完全 性 ， ”我 们 银 唱 3-CNEF-SAT 来 进行 化 简 。 给 定 
个 由 普 个 子 句 组 成 的 关于 nm 个 变量 xx, …,x 的 公式 p， 构 造 图 台 =(V:E) 如 下 。 对 每 个 
变量 和 每 个 变量 的 “ 非 "， 集 合 V 分 别 包 会 一 个 顶点 ， 对 每 个 子 龟 ，V 包含 5 个 项 点 ， 才 外 
V 中 还 有 三 个 特殊 项 点; TRUE,FALSE 和 RED。 图 的 边 分 为 两 种 类 型 , 与 子 句 无 关 的 " 文 
字 " 边 和 依赖 于 子 印 的 “ 子 句 * 边 ， 对 ji= 1,2…m， 文 字 按 形成 一 个 直 特 殊 顶 点 查 成 的 二 
形 ， 并 篆 还 形成 一 个 由 x、 一 和 和 RED 构成 的 三 角形 。 

@d. 论 证 在 对 包含 文字 边 的 图 的 任意 一 个 3 着色 c 中 ， 一 个 变量 和 它 的 “ 非 * 中 枪 好 有 一 
个 被 着 色 为 c(TRUE)， 另 一 个 被 着 色 为 FALSE)。 论 证 对 op 的 任何 真 值 赋值 ， 对 仅 包 含 
文字 过 的 图 都 有 一 种 3 一 着 色 存 在 , 
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图 36.20 所 示 的 附件 图 用 于 实现 相应 于 子 名 (xYyVYz) 的 条 件 。 每 个 子 句 都 要 求 复制 
唯一 的 图 中 涂 黑 的 和 个 顶点 的 一 份 拷贝 ; 如 图 所 示 ， 它 们 把 子 铝 中 的 文字 与 特殊 顶点 
TRUE 相连 ， 

e. 论 证 如 果 x，y 和 z 中 每 个 顶点 均 着 色 为 c(TRUE)] 或 c(FALSE)， 则 该 附件 图 是 3- 
着 色 的 当 且 仅 当 x，y 和 =z 中 至 少 有 一 个 被 着色 为 cTRUE)， 
f 完 成 3-COLOR 是 NP-- 完 全 可 题 的 证 明 。 





36.20 “在 问题 折 -2 中 对 应 于 子 句 (xyz 的 附件 图 
练习 三 十 六 


36.1-1 有 甫 联系 一 个 无 向 围 和 两 个 结 点 的 每 个 实例 与 读 两 结 点 各 的 最 长 简单 路 径 的 长 度 的 关系 来 定义 
最 优化 问题 LONGEST-PATH~LENGTH。 定 义 判 定 问题 LONGEST-PATH={《G av k> 
_G=(V，E) 是 一 个 无 向 天，u，vEV，k2l0 是 一 个 整数 ， G 中 从 十 到 v 存在 一 条 长 度 至 少 为 上 的 简单 路 村 于 

证 明 : 最 优化 问题 LONGHEST- PATH LENGTH 可 以 在 多 项 式 时 间 内 求解 , 当 且 仅 当 
LONGEST-PATHEP。 

36.1 一 2 天 等 四 于 大同 图 中 最 长 的 简单 同 路 问 题 的 水 式 定义 并 定义 与 其 相关 的 到 定 问题 . 给 出 相应 于 
该 判定 癌 题 的 语言. 

36.t-3 试 运用 邻接 矩阵 表示 法 给 出 有 向 图 的 二 进 制 串 形式 编码 。 再 运用 邻接 玫 表 示 法 给 出 其 一 进 串 
形式 编码 。 论 证 这 两 种 表示 是 多 项 式 相关 的 。 

36.1 一 4 关于 练习 17.2~2 中 的 呈 ] 背包 问题 的 动态 规划 算法 是 否 是 一 一 个 多 项 式 时 间 算 法 ? 

36.1-5 人 银 定 一 个 请 言 工 可 以 在 多 项 式 时 间 内 接受 任何 串 xELL， 但 如 果 xEL， 则 相应 算法 的 运行 时 
闻 为 超 多 项 式 时 间 。 论 证 可 以 在 多 项 式 时 间 内 判定 工 。 

36.1-6 证 明 , 对 多 项 式 时 间 子 程序 至 声 作 常数 次 调 计 的 算法 的 运行 时 间 是 多 项 式 时 间 ， 但 对 多 项 式 时 
间 子 稳 序 进行 多 项 式 次 调用 可 能 产生 一 个 指数 时 间 的 算法 。 

36.1-7 证 本 , 失 了 在 被 看 作为 语言 的 集合 时 ， 在 运 等 并、 交 、 并 置 、 补 和 克 林 星 下 是 封闭 的 。 亦 即 ， 
如 果 L，Lze P， 则 和 )L2E P， 等 等 


36.21 考察 语言 GRAPH-ISOMORPHISM = {《〈G，G:》 : O 和 Gu 是 同 拘 图 }。 通 过 描述 一 种 多 项 
式 时 间 算 薄 以 验证 该 语言 ， 证 明 GRAPH--ISOMORPHISM E NP。 


36.2-2 证 明 : 如 果 扣 是 一 个 具有 奇数 个 结 点 的 无 向 二 分 图 ， 则 马 是 非 汉 密 尔 顿 图 . 
36.2 3 证 月 : 如 果 HAM-CYCLEEP， 则 按 次 序列 出 汉密尔顿 回路 中 结 点 的 同 题 是 多 项 式 时 间 可 解 


36.2-4 证 明 , NP 类 语言 在 并 、 交 、 并 置 和 克 林 星 运算 下 具有 封闭 性 。 试 讨论 NP 在 补 算 下 的 封闭 


36.2--5 证 明 : NP 中 的 任何 语言 都 能 由 一 个 运行 时 间 为 25e ) 的 算法 进行 判定 . 
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36.2-6 一 个 图 中 的 没 密 尔 顿 路 径 是 指 公 访问 每 个 铺 点 一 次 的 一 条 简单 路 径 ， 证 明 , 语言 
HAM-PATH={《〈G，、u，v》 :图 口中 从 u 到 v 存在 一 条 汉密尔顿 路 径 } 属 于 NP.。 

36.2-? 证 明 : 在 有 向 无 回路 图 中 汉密尔顿 路 径 问 题 可 以 在 多 项 式 时 间 站 得 到 解决 。 写 出 一 个 求解 该 问 
题 的 有 效 算 法 . 

36.2-8 设 p 是 根据 布尔 输入 变量 xj，x，…， xi， 非 (一 )、 与 (人 人)， 或 《〈Y) 和 括号 构造 成 的 一 
个 布尔 公式 。 如 果 不 论 对 每 个 输入 变量 赋值 1 或 0， 该 布尔 公式 的 取 值 均 为 1， 则 公式 9 是 一 个 重 言 式 。 定 
义 TAUTOLOGY 是 由 重 言 布尔 公式 构成 的 语言 。 

证 轩 ; TAUTOELODGY fk co--NP。 

区.2-9 证 明 ,PEco-NP. 

36.2-10 证 明 :; 如 果 NEP 关 co--NP， 则 P-FNP。 

36.2-11 设 台 是 至 少 包 含 三 个 结 点 的 无 向 连通 图 ，6; 是 把 各 中 长 弃 至 多 为 3 的 路 径 所 连接 的 所 有 对 
结 点 相连 所 得 到 的 图 。 证 明 : 局 : 是 汉密尔顿 图 (提示 : 构造 台 的 生成 树 ， 然 后 用 递归 方法 进行 证 明 ) 


36.3-1 证 明 关 系 所 ,是 定义 在 语言 上 的 传递 关系 即 证 明 如 果 Li 冯 hLa 上 且 L2 冯 L3， 则 志和 0L3、 

36.3-2 证明:L 挟 并 当 且 仅 当 工 志 . 工 。 

36.3-3 证 明 : 在 引 理 36.5 的 另外 一 一 种 证 明 过 程 中 ， 可 以 用 可 满足 性 赋值 作为 证 书 ， 暑 _ 种 证 书 可 以 使 
证 明 过 程 较为 简单 ? 

36.3-4 引 理 36.6 的 证 明 过 程 中 假定 算法 A 的 工作 存 久 器 占用 一 段 多 项 式 规模 的 相 令 区域 在 该 证 明 
.过程 中 和 何 处 用 到 了 这 一 假设 ? 论证 利用 该 假设 不 会 失去 一 般 件 ， 

36.3-5 对 于 多 项 式 时 间 化 简 来 说 ， 语 言 工 对 语言 类 C 是 完备 的 ， 如 果 LEC 并 且 对 所 有 - 《C， 
有 革 ” 所。L 成 立 。 证 明 , 对 于 多 项 式 时 间 化 简 来 说 ， 再 和 !t0，1} "是 P 中 对 了 P 不 完备 的 仅 有 的 语言 。 

36.3-6 证 明 , 工 对 NP 是 完备 的 当 且 仅 当 工 对 co-NP 是 完备 的 ， 

36.3-7 在 引 理 36.6 的 证 明 过 程 中 ， 化 简 函 数 F 是 基于 有 关 x， 和 和 F 的 知识 构造 出 电路 和 = 丸 x) 
的 ， 有 些 人 注意 到 串 x 是 FF 的 输入 ,但 E 仅 知 道 有 和 和 k 存 在 《由 于 语言 世 属于 NP)， 但 并 不 郑 道 它们 
的 确切 值 ， 町 此 ， 他 科 断 定 F 不 可 能 构造 出 电路 C 并 且 语 言 CIRCUIT-SAT 并 不 一 定 是 NP 难度 的 。 试 
说 明 这 种 推理 中 存在 的 缺 卫 。 


36.4-1 考察 一 下 定理 36.9 证 明 过 程 中 的 直接 的 ( 非 多 项 式 时 间 的 ) 化 简 过 程 。 试 找 述 一 个 规模 为 n 
的 电路 ， 使 其 用 这 种 方法 变换 为 一 个 公式 于， 公式 的 规模 为 的 和 酸 。 

36.4-2 ” 试 说 明 对 公式 (36.3) 运用 定理 36.10 的 方法 时 所 得 到 的 3-CNF 公式 。 

36.4-3 Jagesser 教授 提出 公用 定理 36.10 的 证 明 过 程 中 的 真 值 表 技术 (而 无 需 其 他 步 观 ) 就 可 以 证 明 
SAT< 3-CNF-SAT。 就 是 说 ，Jagger 教授 提出 到 布 尔 公 式 g， 形 成 关于 其 变量 的 一 张 真 值 表 ， 根据 真 值 
表 推 出 一 个 形式 为 3-DNE 的 公式 ， 它 等 价 于 一 gp， 然 后 取 反 并 运用 DeMeorgan 定律 以 产生 一 个 与 等 价 
的 3-CNEF 公式 . 证 明 , 运用 这 种 策略 并 不 能 使 我 们 蓝 得 一 个 多 项 式 时 间 的 化 简 等 法 . 

36.4-4 证 明 , 确定 一 个 布尔 公式 是 吾 是 重 言 式 的 问题 对 co-NP 是 完备 的 ， (提示 : 见 绑 习 36.3 一 6 

36.4-5 证 明 : 确定 呈 析 包 范 式 形式 的 布尔 公式 的 可 满足 性 问题 是 多 项 式 时 间 可 求解 的 。 

36.4-6 很 设 现 有 一 个 殖 定 公式 可 满足 性 的 多 项 式 时 间 算 法 。 试 述 如 何 运用 该 算法 在 多 项 式 时 间 内 找 
出 可 满足 性 赋值 

36.4-7 设 2-CNF-SAT 是 每 个 子 句 恰 有 2 个 文字 的 CNEF 形式 的 可 满足 布尔 公式 的 集合 。 证 明 : 
2-CNE-SATE4P。 所 给 出 的 算法 的 效率 应 尽 可 能 高 。 (提示 : 注意 xYy 等 价 于 一 xy。 把 2 一 CNF 一 SAT 
转化 为 一 个 有 向 图 上 能 求解 的 问题 ) 


36.5-1 对 给 定 的 两 个 子 图 同 构 问 题 是 这 样 的 : 图 G, 和 Ga2zG 是 否 是 Ga 的 一 个 子 图 ? 证 明子 图 同 构 
问题 是 NE-- 尘 全 的 。 
36.5-2 已 知 一 个 上 xn 整数 矩阵 A 和 一 个 am 维 整 教 向 量 b，0-1 加 数 规划 问题 是 : 是 否 存 在 其 元 丸 
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属于 集合 10，1 的 一 个 吴 维 整数 向 量 使 得 Ax 和 b。 证 明 0-1 整数 规划 问题 是 NP- 完 全 的 。 (提示 ; 根据 
3-CNF-SAT 进行 化 简 ,) 

36.5-3 证明 恕 果 目 标 值 t 表示 成 一 元 形式 ， 那 么 子 集 和 问题 就 是 多 项 式 时 得 可 求解 的 问题 。 

36.5-4 此 合 划分 问题 的 输 人 是 由 数组 成 的 集合 $，、 其 问题 是 是 否 可 以 把 集合 划分 为 两 个 乏 合 A 和 入 
=S-A， 并 满足 ?xs: Ax= 之 -x。 试 说 明 集 合 划分 问题 是 NP- 完 全 的 。 

36.5-5 证 明 ; 汉 密 水 顿 路 径 问题 是 NP 完全 的 ， 

36.5-6 最 长 简单 回路 问题 是 关于 确定 一 个 图 中 长 度 最 大 的 一 条 简单 回路 〈 其 中 没有 重复 出 现 的 顶 
点 ) 的 问题 ， 证明 该 问题 是 NE 一 完全 的 ， 

让 .5-7 有 人 声称 在 定理 36.14 的 证 明 过 程 中 用 作 附 件 图 A 的 子 图 无 寅 那么 复杂 : 图 36.15(a) 中 的 顶 
点 五 和 环 以 及 其 上 而 和 下 面 的 顶点 都 森 需 要 。 他 的 话 是 否 正 确 ? 就 是 说 ， 化 简 算 法 对 缩小 后 的 附件 图 是 杏 
可 行 ? 酝 件 图 的 “两 者 取 一 "的 性 质 是 理会 因此 而 失去 ? 
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第 三 十 七 章 ” 近 似 算法 


许多 具有 实际 意义 的 问题 都 是 NP- 完 全 的 ， 它 们 非常 重要 ， 所 以 不 能 仅 因为 获得 一 个 
最 优 解 的 过 程 是 不 可 驾驭 的 而 放弃 它们 。 如 果 一 个 问题 是 NP- 完 全 的 ， 我 们 就 不 大 可 能 找 
到 一 个 能 给 出 其 准确 解 的 多 项 式 时 间 算 法 ， 但 这 并 不 意味 着 一 无 希望 了 。 解 决 NP- 完 全 问 
题 有 两 种 方法 。 第 一 ， 如 果 所 有 实际 输入 的 规模 都 较 小 ， 则 用 具有 指数 时 间 的 算法 来 解决 问 
题 就 很 理想 了 。 第 一， 仍 有 可 能 在 多 项 式 时 间 里 (最 坏 情 况 或 平均 情况 ) 找到 近 最 优 的 解 。 
在 实践 中 ， 近 最 优 性 常常 就 足够 好 了 。 能 返回 近 最 优 解 的 算法 称 为 近似 算法 。 本 章 要 介绍 解 
决 包 个 NP-- 完 全 问题 的 多 项 式 时 间 近 似 算法 ， 


近似 算法 的 性 能 界 


假定 我 们 在 解 一 个 最 优化 问题 ， 该 问题 的 每 一 个 可 能 解 都 有 正 的 代价 ， 我 们 希望 找 出 一 
近 皮 碟 解 。 根 据 5 要 解决 的 问题 ， 最 优 解 可 定义 成 具有 最 大 代价 的 解 或 具有 最 小 代价 的 
说 ，, 关 梧 肥 刀 ， 求 最 大 值 的 问题 ， 也 可 能 是 个 求 最 小 值 的 问题 . 

我 们 说 问题 的 一 个 近似 算法 有 着 比值 界 ptn) ， 如 果 对 规模 为 的 任何 输入 ， 由 该 近似 


章法 产生 的 解 的 代价 与 最 优 解 的 代价 C 只 兰 一 个 因子 pn) 


maX ， 去 么 P0n) {37.1) 


这 个 定义 对 求 最 大 值 和 求 最 小 值 问 题 都 成 立 。 对 于 一 个 求 最 大 值 的 问题 ，0<C<C” ， 
而 比值 C ~C 给 出 了 最 优 解 的 代价 大 于 近似 解 的 代价 的 倍数， 类 似 地 ， 对 于 一 个 求 最 小 值 
的 问题 ，0<C ” 窒 C， 比 值 CAC 给 出 了 近似 解 的 代价 天 于 最 优 佣 的 代价 的 倍数 。 因 为 我 们 
假定 了 所 有 解 的 代价 都 是 正 的 ， 故 这 两 种 比值 都 是 良 定 义 的 。 一 个 近似 算法 的 比值 界 不 会 小 
于 1， 因为 CC” <1 昔 含 着 C” 7C> 1。， 在 一 个 最 优 算法 中 ， 比 值 界 为 1。 基 有 较 大 的 比 
巷 界 的 一 个 近似 算法 可 能 返回 较 最 优 解 差 很 委 的 解 。 ， 
有 时 ， 只 考虑 相对 误 莽 的 莉 度 可 能 更 方便 些 。 对 任意 输入， 一 个 近似 算法 的 相对 误差 定 
义 为 : 
IGCC” 
和 前 面 一 样 ， 其 中 的 C ”是 某 一 最 优 解 的 代价 ， C 为 该 近似 算法 所 产生 的 解 的 代价 。 相对 误 
差 总 是 非 负 的 。--- 个 近似 算法 具有 一 一 个 相对 误差 界 E (mn)， 如 时 
IC-C CC 六 代 介 ] . (37.2} 
由 上 面 给 出 的 餐 定 义 可 导出 相对 误差 界 ， 可 由 比值 抠 的 一 个 函数 来 限界 : 
(tn <s<plny 一 1 《37.3) 
(对 于 一 个 求 最 小 值 的 问题 ， 上 式 就 是 个 等 式 ; 对 于 一 个 求 最 太 值 的 问题 ， 我 们 有 E no) 
=(ptnj -1 7 pn)， 它 满足 不 等 式 (37.3)， 因 为 ptnb] 之 1.) 
对 王 许多 问题 ， 已 经 设计 出 了 具有 独立 于 a 的 峰 定 比值 界 的 近似 算法 。 对 于 这 些 问 题 
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来 说 、 我 们 只 要 四 记号 p 或 E 即 可 ， 表 示 与 无 关 。 

对 于 另 一 些 问题 ， 计 算 机 科学 家 至 今 还 没 能 设计 出 任何 具有 一 个 固定 的 比值 界 的 多 项 式 
时 间 的 近似 算法 。 对 于 这 些 问 题 ， 我 们 所 能 做 到 的 就 是 让 比值 界 作为 输 人 规模 的 一 个 画 
数 而 增长 。 这 一 类 问题 的 一 个 例子 就 是 37.3 节 中 介绍 过 的 集合 覆盖 问题 . 

某 些 NP-- 完 全 问题 可 用 比值 界 越 来 越 小 (或 等 价 地 ， 直 来 越 小 的 相对 误差 界 ) 的 近似 
算法 来 解 ， 但 要 占用 越 来 越 多 的 计算 时 间 。 也 就 是 说 ， 在 计算 时 间 与 所 做 近似 的 质量 之 间 可 
作 一 权衡 。 有 一 个 例子 就 是 在 37.4 节 讨 论 过 的 子 集 和 问题 。 这 种 情况 非常 重要 ， 足 以 用 一 
种 单独 的 名 字 来 命名 。 

一 个 最 优化 问题 的 近似 方案 是 这 样 一 种 近似 算法 ， 它 的 输入 蚂 可 以 是 该 问题 的 实例 ， 也 
可 以 是 一 个 值 E >0 使 得 对 任何 固定 的 E ， 这 个 方案 是 个 具有 相对 误差 界 《 的 近似 算法 我 
们 说 一 个 近 亿 方案 是 个 多 项 式 时 间 近 似 方 案 ， 如 果 对 任何 固定 的 E > 0， 该 方案 以 其 输 人 实 
例 的 规模 n 的 多 项 式 时 间 运 行 。 

一 个 多 项 式 近似 方案 的 运行 时 间 不 应 随 E 减 小 面 增长 太 快 。 在 理想 的 情况 下 ， 如 果 E 按 
一 常 斑 子 减 小 ， 为 获得 希望 的 近似 所 花 的 运行 时 间 的 增加 不 应 超过 一 个 常数 因子 。 换 句 话 
说 ， 我 们 希望 运行 时 间 既 是 17/《 的 多 项 式 ， 又 是 mn 的 多 项 式 。 

说 一 个 近似 方案 是 个 完全 多 项 式 时 间 的 近似 方案 ， 如 果 其 运行 时 间 既 为 17 《的 多 项 式 
又 为 输入 实例 的 规模 aa 的 多 项 式 ， 此 处 《 为 该 方案 的 相对 误 差 界 。 例 如 ， 这 种 方案 可 有 运 
行 时 间 (17E ) 2n3。 对 这 样 的 一 个 方案 ，《 的 任意 常数 悦 的 减少 可 由 相应 的 运行 时 间 的 党 
数 倍增 加 来 获得 . 


本 趣 内 容 的 安排 


本 章 的 前 三 节 要 介绍 一 些 解决 NP-- 完 全 问题 的 多 项 式 时 间 近 似 算法 的 例子 ， 最 后 一 节 
要 给 出 一 个 完全 多 项 式 时 间 近 但 方案 。37.1 节 以 对 顶点 覆盖 问题 的 研究 开始 。 这 是 个 NP-- 
完全 的 求 最 小 值 的 问题 ， 它 有 一 个 比值 界 为 2 的 近似 算法 。37.2 节 给 出 了 货 郎 担 问 题 的 一 
个 比值 界 为 2 的 近似 算法 。 在 这 个 问题 中 ， 代 价 范 数 满足 三 角 不 等 式 。 这 一 节 还 证 明了 如 果 
没有 三 角 不 等 式 ， 则 不 可 能 存在 6G -近似 算法 ， 除 非 =NP。 在 37.3 节 里 ， 我 们 要 介绍 在 
集合 覆盖 问题 中 ， 贪 心 方法 如 何 可 被 用 作 一 种 有 效 的 近似 算法 以 获得 一 个 覆盖 ， 使 其 代价 在 
最 差 情 况 下 也 就 出 最 优 代价 大 一 个 对 数 倍 。 最 后 ，37.4 节 给 出 了 子 集 和 问题 的 一 个 完全 多 
项 式 时 间 的 近似 方案 。 


37.1 ”顶点 覆盖 问题 


在 36.5.2 节 中 ， 顶 点 覆盖 问题 被 定 允 和 证 明 为 NE 一 完全 的 。 无 向 图 怠 =({(V，E) 的 一 
个 顶点 杆 盖 是 一 个 子 集 VEV， 使 得 如 果 (、v) 是 G 的 一 条 边 ， 则 或 者 we Y， 或 者 VE 
V“” (或 两 者 都 成 立 )。 一 个 顶点 覆盖 的 大 小 即 其 中 的 项 点数。 

可 点 豫 盖 癌 题 要 求 在 一 个 给 定 的 无 向 图 中 找 出 一 个 具有 最 小 规模 的 顶点 覆盖 。 我 们 称 这 
样 的 一 个 顶点 覆盖 为 一 个 最 优 项 点 覆盖 。 这 个 问题 是 NP 一 难度 的 ， 因 为 根据 定理 36.12 可 
- 短 与 其 相关 的 判定 问题 是 NE 一 完全 的 。 

虽然 在 一 个 图 G 中 寻找 一 个 最 优 顶 点 覆盖 可 能 是 很 困难 的 ， 但 要 找 出 一 个 近 最 优 的 顶 
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点 囊 盖 不 会 很 困难 。 下 面 给 出 的 近似 算法 以 一 个 无 向 图 G 为 输入 ， 并 返回 一 个 其 规模 保证 
不 超过 最 优 顶 点 覆盖 的 规模 两 倍 的 顶点 覆盖 。 


APPROX-VERTEX-COVERIG) 

1 _C< 由 

2 E'“E[IG] 

3 _ while 也 ' 藉 由 

4 do 说 避 中 为 瑟 中 的 任意 一 条 过 

5 CCliu，vY} . 

在 将 与 或 v 关联 的 每 一 条 边 从 已 中 革除 
7 


rettrn 己 


图 37.1 示 出 了 APPROX-VERTEX-COVER 的 操作 过 程 : (alj 具有 七 个 顶点 和 八条 
边 的 输入 图 G。(b)j 以 粗 线条 示 出 的 边 (Be，c) 是 被 APPROX-VERTEX-COVER 所 选 
择 的 第 一 条 边 。 加 了 浅 阴 影 的 顶点 b 和 5c 被 加 和 人 集合 A， 它 包含 了 正 被 构造 的 顶点 覆盖 ， 以 
虚线 示 上 出 的 边 (a，b)、(c. 日 和 (c， 由 被 删除 ， 因 为 现在 它们 由 A 中 交 某 个 顶点 所 构 
盖 。(c) 边 (e， 人 被 加 到 A 中 。(d) 边 (d， 划 被 加 到 A 中 。(ej 集合 A 为 由 
APPROX-VERTEX-COVER 产生 的 顶点 覆盖 ， 它 包 人 省 六 个 顶点 b，c，d，e，f g。 人 
这 个 问题 的 最 优 顶 点 耶 盖 仅 包含 三 个 顶点 : b，d 和 ee。 变量 C 包含 了 正在 被 构造 的 顶点 杆 
盖 。 第 1 行将 C 初始 化 为 空 集 。 第 2 行将 E' 置 为 图 G 的 边 集 E[G] 的 一 个 副本 。 第 3-6 行 
间 的 循环 重复 地 从 E“ 中 选 出 一 条 边 《u， 宁 )， 将 其 端点 u 和 v 加 入 C， 并 删 去 E' 中 所 有 被 
或 v 覆盖 的 边 。 这 个 算法 的 运行 时 间 为 O(E)， 了 /以 一 种 侣 适 的 数据 结构 来 表示 。 





图 37.1 APPROX-VERTEX_CGVER 的 可 入 过 程 ” 


定理 37.1 APPROX-VERTEX-COYVER 有 一 个 比值 界 2 
证 明 : 由 APPROX--VERTEX-COVER 返回 的 顶点 集合 C 是 个 顶点 覆盖 ， 因 为 这 个 
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算法 一 直 循环 至 忆 合 ) 中 的 每 条 边 都 被 C 中 的 某 个 顶点 覆盖 为 止 。 

为 说 明 APPROX-VERTEX-COVER 所 返回 的 顶点 材 盖 药 规 模 至 多 为 最 优 覆 盖 的 两 
倍 ， 我 们 设 A 表示 在 APPROX-VERTEX-COVER 的 第 4 行 中 选 出 的 边 集 。A 中 没有 两 
条 边 具 有 共同 的 端点 ， 因 为 一 旦 一 条 边 在 第 4 行 中 被 选 出 后 ， 在 第 6 行 中 就 将 所 有 与 其 端 点 
关联 的 边 从 E' 中 去 掉 。 所 以 ， 第 5 行 的 每 次 执行 就 将 两 个 新 的 顶点 如 入 C， 衣 ICI=2Al， 
然而 ， 为 了 团 盖 A 中 的 边 ， 任 意 .一 个 顶点 覆盖 一 - 兹 其 是 一 个 最 优 玩 盖 C"” -一 必须 包含 A 
中 每 条 边 的 持 少 一 个 端点 。 又 因为 A 中 没有 两 条 边 具 有 共同 的 端点 ， 故 A 中 屋 有 ~- 个 项 上 
与 案 于 一 条 的 边关 联 ， 所 以 ，|Al<IC "|， 且 ICIK2C 1， 从 而 定理 得 证 。 


37.2 ” 货 部 担 问 题 


在 36.5S 节 引 人 的 货 郎 担 问 题 中 ， 给 定 的 是 一 个 完全 无 向 图 G=(tVY，BE)， 其 每 条 边 
(tu、v) 《 E 都 有 -- 个 非 负 的 整数 代价 cu，v)， 我 们 希望 找 出 马 的 一 个 具有 最 小 代价 的 汉 
密 尔 顿 回 路 〈 即 -游历 )。 作 为 我 们 所 采用 的 记号 的 扩充 ， 设 ce(A) 者 示 子 集 AS 中 所 有 
边 的 总 代价 : 


cl(A)y = 》 ctu，v) 
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在 很 多 实际 情况 中 ， 从 一 个 地 方 直 接 到 另 一 个 地 方 wo 总 是 代价 最 小 的 。 经 由 任何 一 
个 中 转 站 v 的 一 种 路 从 不 可 能 具有 更 小 的 代价 了 。 换 种 方式 说 ， 去 掉 一 个 中 间 站 次 不 会 增加 
代价 。 我 们 可 对 种 概念 形式 化 ， 即 说 代价 函数 ec 满足 三 角 不 等 式 : 如 果 对 所 有 顶点 ， Y， 加 
V， 有 

cu， 责 ) 所 eltu，Yv) 二 etvY，) 

所 角 不 等 式 是 个 很 自然 的 不 等 式 ， 在 许多 应 用 中 它 都 能 自动 得 到 满足 。 例如， 如 有 要 图 的 
顶点 为 平面 上 的 点 ， 且 在 两 个 顶点 问 旅 行 的 代价 邯 为 它们 之 间 通 常 的 欧 几 里 德 上 臣 离 ， 则 三 角 
不 等 式 就 被 满足 了 。 

如 练习 37.2 一 1 所 说 明 的 ， 规 定 代价 函数 要 满足 三 角 不 等 式 不 能 改变 货 郎 担 问 题 的 NP-- 
完全 性 。 因 此 , 不 可 能 找 出 一 个 准确 解决 这 个 问题 的 才 项 式 时 间 算 法 ， 因 而 就 要 寻找 一 些 好 
的 近似 算法 。 

在 37.2.1 节 中 ， 我 们 上 要 讨论 一 个 解决 符合 三 角 不 等 式 的 货 郎 担 癌 题 的 近似 算法 , 它 具 有 
比值 界 2。 在 37.2.2 节 中 ， 我 们 要 证 明 如 果 不 符合 三 角 不 等 式 ， 则 不 存在 具有 常数 比值 界 的 
近似 算法 ， 除 非 P=NP。 


37.2.1 满足 三 角 不 等 式 的 货 即 担 问题 


下 面 的 算法 利 出 24.2 节 中 的 最 小 生成 树 算 法 MST-PRIM 来 求 出 一 个 无 向 图 G 中 的 一 
个 近 最 优 游 历 。 我 们 将 看 到 当代 价 函 数 满足 三 角 不 等 式 时 ， 这 个 算法 所 返回 的 游历 路 线 不 会 
差 于 一 个 最 优 游 历 路 线 的 两 入 长 。 


APPROX-TSP-TOURIG，c) 
1 选择 一 个 硕 点 r V[G] 为 * 根 "顶点 


696- 


2 利用 MST-PRIM(G，c， 站 从 根 开始 为 台 构造 一 机 最 小 生成 树 T 
3 壮 世 为 对 工 的 前 序 树 演 贰 中 所 访问 的 顶点 的 列表 
4 return 以 多 译 工 访问 各 项 点 的 议 密 钦 顿 回路 本 


铝 忆 我 们 在 13.1 节 中 说 过 ， 前 序 树 过 历 递归 地 访问 树 中 每 个 顶点 ， 在 第 一 次 遇 到 某 个 
顶点 时 在 访问 其 子女 之 前 ) 就 列 册 该 顶点 。 





图 37.2 APPROX-TSP-TOUR 的 操作 过 程 


图 37.2 说 明了 APPROX-TSP-TOUR 的 操作 过 程 ， 其 中 : (al) 给 定 的 反 的 集合 。 这 
些 点 分 布 十 一 个 整数 格 栅 的 顶点 上 。 例 如 ，f 处 在 右 方 1 个 单位 ， 上 方 2 个 单位 。 通 常 的 
爽 几 里 德 距 离 被 用 作 丙 个 点 之 间 的 代价 困 数 。(b) 这 些 点 的 一 棵 最 小 生成 树 T， 如 由 
MST-PRIM 计算 出 来 的 一 样 。 顶 点 a 为 根 。 各 顶点 的 标号 恰好 使 它们 按 字 母 顺 序 由 
MST-PRIM 加 入 主 十 树 中 。(e) 对 工 的 一 次 开始 于 a 的 遍历 。 对 该 树 的 一 次 完全 人 遍历 要 访 
问 顶 点 a，b，c，b，h，b，a，d，gs，f， ee，g，e，gd，a。 在 对 工 的 一 次 前 序 遍 押 中 ， 每 当 
第 一 次 过 到 其 顶点 时 就 将 其 列 出 ， 从 而 得 到 序列 a，b，c，h，d，e, 人 外 (d) 按 前 序 遍 
历 所 给 出 的 译 访 问 各 顶点 所 得 的 一 个 游历 。 此 即 由 APPROX-TSP-TOUR 返回 的 游历 
HBH。 其 总 代价 约 为 19.074。({e) 对 给 定 的 顶点 集合 的 一 个 最 优 游 历 H 。 其 总 代价 约 为 
14.715, tt(d) 中 的 大 约 要 短 23%。 

AbPROX-TSP-TOUR 的 运行 时 间 为 @(E) =@(V23] ， 因 为 输入 的 是 个 完全 图 ( 见 练 
习 34.2-2)。 现 在 我 们 来 证 明 ;, 如 果 货 郭 担 问 题 的 某 一 实例 的 代价 函数 满足 三 角 不 等 式 ， 册 
和 APPROX-TSP-TOUR 所 返回 的 孵 历 的 代 价 不 大 于 一 个 最 优 久 历 的 代价 的 两 倍 。 

定理 37.2 APPROX-TSP-TOUR 是 一 个 解决 满足 三 角 不 等 式 的 货 部 担 癌 题 的 比值 界 
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为 2 的 近似 算法 。 
证 明 : 设 瓦 ” 表示 对 给 定 顶 点 集合 的 -- _ 个 最 优 游历 . 这 个 定理 的 一 种 等 价 表述 为 c(H) 
<2c (H”)] ,其 中 理 为 APPROX~TSP-TOUR 返回 的 游历 路 线 。 色 为 我 们 是 通过 秋 除 一 
个 游历 路 线 中 的 任 一 条 边 而 得 到 一 棵 生成 树 ， 故 如 果 工 是 关于 给 定 顶 点 集合 的 一 棵 最 小 生 
成 树 ， 则 
ctT) <c(H”) G7 忆 
对 了 的 一 个 完全 亡 押 在 初 侈 访问 一 个 顶点 以 及 在 从 访问 某 个 顶点 的 一 棵 子 树 返 回 后 列 
出 该 顶点 : 我 们 可 以 称 这 个 遍历 为 Ww。 对 我 们 的 例子 中 树 的 一 个 完全 遍历 就 得 到 次 序 
8&，hb，c，b，h，b，a，d，e，f， ee，g，8， 才 ，& 
因为 该 完全 和 遍历 恰 经 过 工 的 每 条 边 两 次 ， 所 以 有 


cfW) =2cfT) (37.5)} 
或 (37.4) 和 (37.5) 草 含 着 . 
cf(WJ] <2cf(H ”) ， (37.6) 


即 到 的 代价 在 最 优 游 历 的 代价 的 两 倍 之 内 。 
但 不 幸 的 是 ，W 一 般 来 说 不 是 一 个 游历 ， 因 为 它 对 于 某 些 顶点 要 访问 一 次 以 上 。 然 
而 ， 根 据 三 角 不 等 式 ， 我 们 可 从 妈 中 去 掉 一 次 对 任意 顶点 的 访问 而 不 增加 代价 。( 恕 果 从 
胸中 对 在 对 顶点 u 和 ww 的 访问 之 间 去 掉 顶 点 v， 所 得 的 游历 次 序 就 指示 了 直接 从 到 m. ) 
反复 应 用 这 个 操作 ， 我 们 可 以 从 到 中 将 对 每 个 顶点 的 除 第 一 次 访问 之 外 的 各 次 访问 去 掉 。 
在 我 们 的 鲍 子 中 ， 这 样 的 一 个 操作 过 程 即 可 得 游历 次 序 
8，b，Cc，h，d，e，f 
这 个 次 序 与 对 树 工 做 前 序 遍 上 押 所 得 的 次 序 是 一 样 的 。 设 下 为 对 应 这 个 前 序 遍 历 的 回 
路 ， 它 是 个 汉密尔顿 回路 ， 因 为 每 个 顶点 仅 被 访问 一 次 ， 并 县 它 实 际 上 是 由 
APPROX-TSP-TOUR 计算 出 来 的 回路 。 因 为 再 是 通过 从 完全 明 历 W 中 出 除了 革 些 节点 
后 得 到 的 、 故 有 
c(H) <c(W) 07.7) 
不 等 式 (37.6] 和 (37.7} 合 起 来 就 完成 了 对 本 定理 的 证 明 。 
尽管 定理 37.2 给 出 了 很 好 的 比值 界 ， 但 在 实 距 中 APPROX-TSP-TOUR 通常 并 不 是 
解决 货 郎 担 问 题 的 最 佳 选择 。 另 外 有 些 近似 算法 的 实际 性 能 要 比 这 个 算法 好 很 多 。 


37.2.2 “一般 货 郎 担 问题 


如 果 我 们 去 掩 关于 代价 画 数 c 满足 三 角 不 等 式 的 假设 ， 则 不 可 能 在 多 项 式 时 间 内 找到 好 
的 近似 游历 路 线 ， 除 非 P=NP， 

定理 37.3 如 果 P 关 NP 且 p>>1， 则 对 一 般 货 即 担 问题 不 存在 具有 比值 界 p 的 当 项 式 时 
间 近 似 算法 。 

证 明 : 用 反 证 法 来 证 明 。 人 很 设 对 某 个 数 p 之 1， 存 在 一 个 比值 界 为 p 的 多 项 式 时 间 近 似 
章法 A。 不 失 一 般 性 ， 假 定 p 是 一 个 整数 〈 必 要 的 话 可 对 其 取 整 )。 我 们 要 来 说 明 如 何在 铬 
项 式 时 间 内 用 A 来 解决 汉密尔顿 回路 问题 (其 定义 见 36.5.5. 节 } 的 各 种 实例 。 由 定理 36.14 
可 知 ， 汉 密 尔 顿 回路 问题 是 NP- 完 全 的 ， 因 而 根据 定理 36.4 可 知 ， 在 多 项 式 时 间 内 解决 这 
个 问题 就 蕴含 着 P= NP。 
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设 怠 =(V，E)} 为 汉密尔顿 回路 问题 的 一 个 实例 。 我 们 希望 通过 利用 假想 的 近似 算法 A 
来 有 效 地 确定 G 是 否 包含 一 个 汉密尔顿 回路 。 我 们 如 下 来 将 G 变 为 货 郧 担 问 题 的 一 个 实 
例 . 设 台 =(V，E") 为 V 上 的 完全 图 ， 也 就 是 说 ， 

Eu，v): U，vCV， 且 uv 

再 对 E“ 中 的 每 条 边 如 下 地 赋 以 一 个 整数 代价 : 
人 如 时 人 oa，vY) EE 
plIVI+1i 否则 

G“ 和 e 的 表示 可 在 |vl 和 局 | 的 多 项 式 时 间 内 由 台 的 表示 构造 出 来 。 

现在 来 考虑 货 郎 担 问 题 (G"，cj 。 如 果 原 图 G 中 存在 一 条 汉密尔顿 回路 苹 ， 则 代价 函 
数 c 对 下 中 的 每 条 边 赋 以 代价 1， 央 而 《G"，ecj 中 包含 了 一 个 代价 为 |VI 的 游历 。 另 一 方 
面 、 如 果 G 中 不 包含 一 条 汉密尔顿 加 路、 那么 G 的 任意 一 个 畴 历 必要 用 到 不 在 E 中 的 某 条 
边 。 但 任意 的 一 个 用 到 不 在 卫 中 的 边 的 游历 的 代价 至 少 为 

(pvVHD ATVFb >p 

因为 不 在 所 中 的 边 的 代价 如 此 之 大 ， 故 一 个 为 G 中 的 汉 密 尔 凶 加 路 的 孵 历 的 代价 为 
IvVl 与 任何 其 他 游历 的 代价 (大 于 plVD 之 闪 杠 差 很 大 

如 果 我 们 对 货 郎 措 问 题 (《G“，ec) 应 用 近似 算法 A 将 会 怎样 呢 ? 因为 A 能 保证 司 其 返 
回 的 游历 的 代价 不 大 于 一 个 最 优 游历 的 代价 的 p 倍 ， 故 如 果 G 包 合 一 个 汉密尔顿 回路 ， 则 

A 必 返 回 它 。 如 果 G 不 包含 汉密尔顿 同 路 ， 则 A 就 会 返回 一 个 代价 大 于 plwI 的 游历 . 所 
以 ， 我 们 可 用 A 来 在 多 项 式 时 间 内 解决 汉密尔顿 回路 问题 . 


37.3 ”集合 覆 瘟 问题 


clu，v] = 


集合 覆盖 问题 是 一 个 最 优化 问题 ， 它 模型 化 了 许多 资源 选择 问题 , 并 推广 了 NP-- 完 全 的 
顶点 覆盖 问题 ， 因 而 也 是 NP-- 难 度 的 。 然 而 ， 用 于 解决 顶点 覆盖 问题 的 近 亿 算法 在 这 儿 就 
用 不 上 了 ， 需 要 尝试 另 一 些 途 径 。 我 们 要 讨论 一 种 简单 的 带 对 数 比值 界 的 贪心 启发 式 方法 。 
亦 即 ， 随 着 实例 的 规模 逐渐 增 大 ， 相 对 于 一 个 最 优 解 的 规模 来 说 近 仙 解 的 规模 也 可 能 增 大 . 
但 是 ， 击 于 对 数 函 数 增长 很 慢 ， 故 这 个 近似 算法 可 能 会 产生 出 很 有 用 的 结果 来 。 

集合 骤 盖 问题 的 一 个 实例 (X，F) 由 一 个 有 诊 集 买 和 一 个 和 的 子 集 族 上 构成， 且 蕊 
的 每 一 个 元 素 属 于 下 中 的 至 少 一 个 子 集 : 

X= 人 JS 


我 们 说 一 个 子 集 SeF 覆盖 了 它 的 元 素 . 这 个 问题 是 要 找到 一 个 最 小 规模 子 集 C 三 下 ， 
使 其 所 有 成 员 覆 盖 庆 的 所 有 成 员 : 


X= 人 US 7.9) 
我 们 说 任何 满足 方程 (37.8) 的 C 巴 盖 文 图 37.3 说 明了 这 个 问题 ,其 中 X 包 售 12 个 
黑 点 ，F= {S,，S,，S;，S,，S$,，S,}， 一 个 最 小 规模 集合 枝 盖 为 C= {S;，S,，S$;}。 通 过 按 


序 选 择 集合 S,，S,，S* 和 S;， 贪 心算 法 产生 出 一 个 大 小 为 4 的 年 盖 . 
集合 覆盖 问题 是 对 许多 常见 的 组 合 问题 的 一 个 抽象 。 作 为 一 个 简单 的 例子 ， 假 设 双 表 
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示 解 决 某 一 问题 所 需 的 各 种 技 : 浅 的 集合 ， 且 我 们 有 一 个 给 定 的 可 用 来 解决 该 问题 的 人 的 舍 
合 。 我 们 希望 组 成 一 个 包含 尽 可 能 少 的 人 的 委员 会 ， 使 得 对 X 中 每 种 必需 的 技巧 ， 在 委员 
会 中 都 有 一 位 成 员 掌握 该 技巧 。 在 集合 覆盖 问题 的 判定 版 本 中 ， 我 们 想 知 道 的 是 是 否 存在 一- 
个 规模 至 多 为 k 的 萎 盖 ，Kk 是 在 该 问题 的 实例 中 规定 的 一 个 附加 参数 。 这 个 问题 的 判定 版 本 
是 NP-- 完 全 的 ， 练 习 > ? “机 求 读者 评 明 这 一 点 。 





疼 37.3 集合 更 盖 问 题 的 一 个 实例 〈X，F) 
一 个 贪心 近似 算法 
贪心 方法 在 每 一 阶段 都 选择 能 覆盖 最 多 的 未 被 覆盖 的 元 素 的 集合 S。 


与 REEDY 一 SET 一 COYVBRRIX，F) 

1 UD<=- 其 

2 人 <- 直 

3 _ while  U 玉 中 

do ”选择 一 个 能 使 B 门 UI 最 大 的 8S 包 食 下 
5 TU 一 息 

避 C<CUSi 

7 _ returna 苇 


在 图 37.3 的 铺子 中 ，GREEDY-SET~-COVER 按 序 将 C 加 人 到 集合 SI、S4，、S$s、S; 
中 。 
这 个 算法 的 工作 过 程 是 这 样 的: 在 每 个 阶段 ， 集 含 U 包含 由 余下 的 未 被 覆盖 的 元 素 构 
成 的 集合 ;集合 C 包含 正在 被 构造 的 覆盖 。 第 4 行 是 贪心 决策 步 葬 ， 即 要 选 出 一 个 能 履 盖 
筷 可 能 多 的 未 被 覆盖 的 元 索 (可 任意 打 断 连接 ) 的 子 集 $9。 在 8 被 选 出 后 ， 将 其 元 素 从 TU 
中 去 挤 ， 并 将 $ 置 于 C 中 。 当 该 算法 结束 时 ， 集 合 C 就 包含 一 个 覆盖 和 的 下 的 子 族 。 
很 容易 实现 算法 GREEDY-SET~COVER 使 之 以 | 双 | 和 IE 的 多 项 式 时 办 运行 。 因 为 第 
3-6 行 间 循 环 的 次 数 至 多 为 min([XI|，|Fl)， 又 可 将 循环 体 实 现成 以 时 间 O(XWFi) 运行 ， 故 
存在 一 个 运行 时 间 为 DGXIFImindXI，IE)) 的 实现 。 练 习 37.3-3 要 求 读 者 给 出 一 个 线性 时 
间 的 算法 ， 


分 析 
下 面 来 证 明 以 上 的 贪心 算法 可 返回 一 个 比 最 优 集 合 必 次 大 不 了 很 多 的 集合 覆盖 。 为 方便 
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起 见 ， 在 本 章 中 我 们 用 H(d) 来 表示 第 d 级 调和 数 H, = ' 17i ( 见 3.1 节 )。 

定理 37.4 GREEDY-SET-COVER 有 一 比值 界 

HmaxflSl， SETF)) 

证 明 : 证 明 过 程 是 这 样 进行 的 : 对 每 一 个 由 该 算法 选 出 的 祭 合 冉 予 个 代价 ， 将 这 一 代 
价 分 布 于 初次 被 覆盖 的 元 素 上 ， 再 利用 这 些 代价 来 导出 一 个 最 优 和 集合 甫 盖 和 "的 规模 和 由 该 
算法 返回 的 集合 狂 盖 C 的 规模 之 间 的 关系 。 设 8 表示 由 GREEDY-SET-COVER 所 选 出 
的 第 i 个 子 集 ; 在 将 $ 如 人 C 中 时 有 代价 1。 我 们 将 这 个 选择 8 的 代价 均匀 地 分 布 于 首次 
被 Si 覆盖 的 元 素 之 上 。 设 c 表示 分 配给 元 素 x 的 代价 ,，xE X。 对 每 一 个 元 素 只 分 配 一 次 代 
价 ， 即 当 它 被 首次 枫 靖 时 分 配 一 个 代价 。 如 果 x 首 次 被 $, 覆 益 ， 贴 
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波 生 法 扶 册 的 解 的 总 代价 为 |C， 这 个 代价 被 分 布 于 的 元 素 上 。 由 于 最 优 现 盖 C ”也 
材 盖 X， 故 我 们 有 


ICI= c 
及 三世 


< 也 Ze, 37.9) 


证 明 的 余下 部 分 的 关 链 在 于 以 下 的 不 等 式 , 我 们 稍 后 就 要 对 它 进 行 证 明 。 对 属于 族 下 
的 任何 集合 S， 有 


ec 近 HGS) 四 67.10) 
根据 不 等 式 (37.9) 和 (37.10) ， 可 得 
ICI<s > HIOS|) 


过 |C | . Htmax{fls|，SeF)}) 
这 就 证 明了 该 定理 。 现 在 来 证 明 不 等 式 (37.10) 。 
对 任意 集合 SEE 和 i=1，2，…, IC : 设 
= 虹 - 《SiS USD | 
为 S,，S2，…，85; 被 该 算法 选 出 之 后 $ 中 余下 的 未 被 槛 盖 的 元 素 个 数 。 定 义 uu=iS| 为 S 中 
元 素 | 的 个 数 ， 设 k 为 满足 m=0 的 最 小 下 标 ， 使 得 $ 的 每 个 元 


素 至 少 被 集合 S,，S2，…，Sk 中 之 一 所 覆盖 。 这 样 ， 对 i= 1，2，…，k，uw-_iuw, 且 S 中 
共有 u_ 1 一 ui 人 于 是 有 
2c， -Zo ,- _ ET US USD 
注意 到 


ItSUSUUS-D IIS-(SiUS2 US-) = 
这 是 因为 对 $i 的 贪心 选择 保证 了 S 不 可 能 比 & 要 盖 更 多 的 新 元 素 (否则 ， 选 出 的 就 会 是 8 


8 


而 不 是 Si) 。 由 此 可 得 
-之 c。 委 2 ， 一 Di) ” 一 
5 ij 一 1 
对 整数 a 和 b (a<b) ， 我 们 有 
Htb) 一 HLaj 三 > > 一 a) 5 


1 一 有 十 1 


利用 这 个 不 等 式 ， 我 们 可 得 套 选 和 式 





ec 拟 2 (HG )) 一 Htui) 小 
==Hu) 一 Hu，) 
=Hta ) 一 HI0) 
= Htu，) 

一 于 (|) 


因为 H(0) =0。 这 就 完成 了 对 不 等 式 (37.10) 的 证 明 . 
推论 37.5 _GREEDY-SET-COVER 有 一 比值 界 《InIXI+1)。 

证 阴 : 利用 不 等 式 (3.12) 和 定理 37.4 即 可 。 

在 某 些 庶 用 中 ，maxflsi: SEE 是 个 较 小 的 常数 ， 这 种 情况 下 由 GREEDY- SET- . 
COVER 返回 的 解 就 至 多 比 最 优 解 大 一 个 很 小 的 常数 倍 。 有 一 个 这 样 的 应 用 是 这 种 启发 式 被 
用 来 获得 一 个 顶点 的 度数 圣 多 为 3 的 图 的 一 个 近似 顶点 蓝 蕾 。 在 这 种 情况 中 ， 由 
GREEDY-SET-COVER 找 出 的 解 不 大 于 一 个 最 优 解 的 HG) =11 区 6 悦 ， 这 个 性 能 保证 
比 APPROX-VERTEX-COVER 的 要 赂 好 一 些 . 


37.4 子 集 和 问题 


子 集 和 的 问题 的 一 个 实例 是 一 个 对 (S，t)， 其 中 8 是 一 个 正 整 数 的 集合 {xi，xz，…， 
x }，t 为 一 个 正 整 数 。 这 个 判定 问题 是 问 是 否 存在 S 的 一 个 子 集 ， 使 得 其 中 的 数 加 起 来 恰 为 
目标 值 t+。 这 个 问题 是 NP-- 完 全 的 〔 见 36.5.3 节 )。 四 

与 此 判定 问题 相 联系 的 最 优化 问题 常常 出 现 于 实际 应 用 之 中 。 在 这 种 最 优化 问题 中 ， 我 
们 希望 找到 fx,，x，…，x} 的 一 个 子 集 ， 使 其 中 元 素 相 加 之 和 尽 可 能 地 大 ， 但 不 能 大 于 上 
例如 ， 假 设 我 们 有 一 辆 能 装 不 多 于 t 磅 重 的 货 的 卡车 ， 并 有 个 不 同 的 盒子 要 装运 ， 其 中 第 
i 个 的 重量 为 x 磅 。 我 们 希望 在 不 超过 重量 极限 的 前 提 下 将 货 尽 可 能 地 装 满 卡 车 。 

在 这 一 节 里 ， 我 们 先 给 出 解决 这 个 最 优化 问题 的 一 个 指数 时 间 算 法 ， 然 后 说 明 如 何 来 笑 
改 筹 法 , 使 之 成 为 一 个 完全 多 项 式 时 间 的 近似 方案 。 (一 个 完全 多 项 式 时 间 近 似 方案 的 运行 
时 间 为 17《 以 及 nm 的 多 项 式 。) 


一 个 指数 时 间 算 法 


如 果 工 是 一 个 由 正 整数 构成 的 表 ，x 是 一 个 正 整数 ， 我 们 就 用 L+x 来 表示 通过 对 工 中 
每 个 元 素 增 加 x 而 导出 的 整数 列表 。 人 例如， 如果 下 = <1，2，3，5，9>， 则 +2 一 <3， 
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4，5，7，1il> 。 我 们 也 对 集合 应 用 这 个 记 叶 ， 
SA+X 一 {STX: Sf《 S} 
我 们 用 一 一 个 辅助 过 程 MERGE_LISTS(L 1，) 来 返回 对 它 的 两 个 已 排序 的 输入 列表 
L 和 ZL ”合并 后 所 产生 的 排序 列表 。 像 我 们 在 合并 排序 中 用 到 的 MERGE 过 程 一 样 〈 见 
1.3.1 节 ) ，MERGE- LISTS 的 运行 时 间 为 OULI+1L” II) 【〔( 这 里 我 们 就 不 给 出 
MERGE-LISTS 的 擅 代 码 了 )。 过 程 EXACT-SUBSET~-SUM 的 输入 为 一 个 集合 S= 1x， 
x,，…，x} 和 一 个 目标 值 t。 


王 基 页 赤 T 一 SUBSET 一 SUMILS，b 
ne< -| 
Les - 疼 自 > 
tor 雇 -to 艺 
do LeMERGE-LISTS(L ,，L_ +HX) 
从 工 ; 中 删除 比 + 大 的 元 素 
returm  IL, 中 最 大 的 元 素 


全 nm 和 Wo 一 


设 P; 表示 通过 选择 fxi，x，…，z} 的 一 个 【可 能 为 空 的 ) 子 集 并 将 其 成 员 加 起 来 所 得 
到 的 所 有 值 的 集合 。 例 如 ， 如 果 S$={1，4，， 则 
= 人，1}， 
了 .一 10，1，4， 引 ， 
一 10、1，4，5，6，9，10} 
葵 定 等 式 
Pi= Pi 上 (PiTxi) (37.11) 
我 们 能 通过 对 i 的 时 纳 来 证 明 .《 见 练习 37.4-1， 表 工 是 一 个 包含 P 中 的 所 有 值 不 大 于 
t 的 元 素 的 有 序 表 。 因 为 工 ; 的 长 度 可 大 奎 %， 故 一 般 来 说 EXACT-SUBSET-SUM 是 一 个 
指数 时 间 算 法 。 在 t 为 |8 的 多 项 式 或 $ 中 的 所 有 成 员 由 疏 | 的 一 个 多 项 式 限 界 的 特殊 情况 下 ， 
EXACT--SUBSET-SUM 是 一 个 多 项 式 时 间 算 法 。 


一 个 完全 多 项 式 时 间 近 似 方 案 


对 子 集 和 问题 我 们 可 以 导出 一 个 完全 多 项 式 时 间 近 似 方案 ， 方 法 是 在 每 个 表 工 , 被 创建 

后 对 它 进行 修整"， 这 时 要 用 到 一 个 参数 3， 且 0<5<1. 按 5 来 修整 一 个 表 工 ， 意 即 以 这 
笠 一 种 方式 来 从 工 中 去 除 尽 可 能 多 的 元 案 ， 即 如 果 世 ”为 修整 工 后 的 结果 ， 则 对 从 工 中 去 
除 的 每 个 元 素 y。 存 在 一 个 仍 在 工 ″′ 中 的 元 素 z<y， 使 得 

y 一 Z 7 Y 忌 . 
或 等 价 地 

【1 一 5) yc<ezsy 
”我 们 可 以 将 这 样 的 一 个 z 看 成 是 在 新 表 工 ′ 中 表示 了 y。 每 个 了 都 由 一 个 z 来 表示 ， 使 
得 参照 y 来 看 z 的 相对 误差 圣 多 为 5。 例 如 ， 如 果 5=0.1， 且 

工 一 一 训 D，11，12，15，20，21，22，23，24，29>> 
则 我 们 可 以 修整 工 而 得 

1LL ”一 <10，12，154，20，23，39>> 


其 中 被 删除 的 值 11 由 10 表示 ， 被 删除 的 值 24 和 22 出 20 表示 ， 被 删除 值 24 由 23 天 示 。 
有 一 点 很 重要 ， 就 是 要 记 住 表 的 修整 过 的 版 本 也 是 表 的 原版 本 的 一 个 元 素 。 对 一 个 表 加 以 修 
整 可 以 大 大 减少 表 中 的 元 素 ， 局 时 还 可 在 表 中 为 每 个 被 从 该 表 中 删除 的 元 索 保 留 一 个 与 其 很 
矿 近 的 〈 且 略 小 一 些 ) 的 代表 值 。 

下 面 给 出 的 过 程 在 时 间 @tm) 内 修整 一 输入 表 工 = <Y，Y，…， 加 > ， 假 定 工 
名 排 或 非 降 次 岸 。 访 过程 的 输 册 是 一 个 修整 过 的 、 排 序 的 表 。 


TRIMIL，6) 

1 me 任 | 

3 工 ”′*-< 芭 yi > 

了 和 St 一 yi 

4 ferfr ia 2 to 记 

5 da 证 旨 时 < 妆 (一直 秃 
折 tten 将 7 拼接 到 L ”的 尾部 
了 last< yi 

8 return 工 - 


世 的 苑 素 被 按照 递增 次 序 加 以 扫 摘 ， 而 一 个 数 被 如 入 返回 药 列 表 世 '′ 中 ， 仅 当 它 是 工 的 
之 一 个 元 素 或 如 果 它 不 能 由 最 近 被 放 人 工 ′ 中 的 数 来 表示 。 

给 定 过 程 TRIM， 我 们 可 以 像 证 面 这 样 来 构造 近 仆 方案。 这 个 过 程 的 输 大 为 一 个 集合 
= 1 其 ss “”””， X { 亿 含 以 任意 次 序 放 晤 的 n 个 整数 )， 一 个 筷 标 整数 二 区 政 一 个 * 近 和 专 
订 数 " 忆 ， 此 处 0< 一 1， 

总 碧 已 信心 其 一 SU BBSETT 一 STM(SS，t，( ) 

1 ms- 二 | 

二 工 r- 殷 日 > 

了 for is:LI to 也 
4 do L<-MERGE-LISTS(L_,，L HAx) 
5 Lis-TRIMIL 下 7“m 
6 从 工 中 删除 每 个 比 + 大 的 元 素 
?7 让 z 为 二 中 最 大 的 倘 
臣 


TetUrtl 了 


第 2 行将 表 Lo 初始 化 为 仅 包 含 元 素 0 的 一 个 表 。 第 3-6 行 间 的 钳 环 的 效果 为 将 工 ; 作为 
- :个 包含 集合 Pi 的 适当 修整 版 本 【去掉 了 所 有 大 于 + 的 元 束 ) 来 计算 。 因 汶 工 ; 是 从 Li _; 构 
出 来 的 ， 碘 我们 必须 保证 重复 的 修整 不 会 引 人 太 多 的 不 叭 确 性 .下面 我 们 将 看 到 
:PPROX-SU8BSET-SUM. 能 返回 一 个 正确 的 近似 〈 如 果 存 在 的 话 )。 

作为 一 个 例子 、 仍 设 我 们 有 实例 

L= <104，102，201，101 > 

:tt= 308，、=0.20。 修 整 参 数 5 为 《 /4=0.05. 

APPROX-SUBSET-SUM 在 所 指示 的 各 行 上 计算 出 如 下 的 一 些 值 : 

第 2 行 : Lu= <D> 

第 4 行 : L;= <0，104> 

第 5S 行 : 站 = <0，104 > 
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第 6 行 : = <0，104> 

第 4 行 : ,= <0，102，104，206> 

第 S 行 : L ;= <0，102，206> 

第 6 行 : ,= <0，102，206> 

第 4 行 : 工 ,= <0，102，201，206，303，407> 

第 5 行 : L4= <0，102，201，303，407> 

第 6 行 : Li= <0，102，201，303>， 

第 4 行 : 1L.= <0，101，102，201，203，302，303，404> 

第 5 行 : = <0，101，201，302，404> 

第 6 行 ，L= <0，101，201，302> 

该 算法 返回 z= 302 作为 其 等 案 ， 它 在 最 优 答案 307= 104+102+101 的 E =20% 之 内 ; 
实际 上 ， 它 是 在 其 2%% 之 内 。 

定理 37.6 ”APPROX-SUBSET-SUM 是 关于 子 集 和 问题 的 一 个 完全 多 项 式 时 间 近 似 
方案 。 

证 明 : 第 $ 行 修整 Li 以 及 从 工 ; 中 去 除 每 个 大 于 的 元 素 , 该 操作 保持 了 Li; 的 每 个 元 素 
同时 也 是 P; 的 成 员 的 性 质 。 所 以 ， 在 第 8 行 返回 的 值 z 确 实 为 8 的 某 个 子 集 的 元 素 之 和 。 
余下 的 是 划 证 明 它 不 小 于 一 个 最 优 解 的 1-6E 倍 。 《请 注意 因为 子 集 和 扣 题 是 一 个 求 最 大 值 的 
问题 ， 故 方程 (37.2) 等 价 守 CI-C) <C) 我 们 还 必须 证 明 该 算法 以 多 项 式 时 间 运 
行 。 
为 了 证 明 所 返回 答案 的 相对 误 善 很 小 ， 注 意 到 当 表 Li 被 修整 时 ， 我 们 在 保留 下 来 的 代 
表 值 和 修整 前 的 值 之 问 引入 的 相对 误差 至 多 为 E /vn。 通 过 对 站 做 归纳 ， 可 证 明 对 P, 中 每 个 
笠 多 为 1 的 邢 素 y， 存 在 一 个 zK Li 使 得 


(1-” mn) Y<z<sy {37.12) 
如 果 y”、 了 ,表示 子 集 和 问题 的 一 个 最 优 艇 ， 则 存在 一 个 z&E 工 ， 使 得 
{1 一 、“ ny "yY 坟 Z<RY (37.13) 


满足 上 述 条 件 的 最 大 的 z 值 是 由 APPROX-SUBSET-SUM 所 返回 的 。 因 为 可 证 明 
ddntl-、n) "> 0， 
趴 数 (4-5 “mm "和 戎 着 市 递 增 ， 这 样 mn> 1 就 草 含 
1 一 、 < (1 一 “nj ” 
于 是 有 
(1 一 人 ) yY 忌 -z 
由 此 可 见 ， 由 APPROX-SUBSET-SUM 所 返回 的 值 z 不 小 于 最 优 解 y "的 1 一 E 倍 ， 
为 了 证 明 这 是 个 宪 全 多 项 式 时 间 的 近似 方案 ， 我 们 来 导出 一 个 关于 L; 的 长 度 的 界 。 在 
妖 整 后 ，Li 中 连续 的 元 素 z 和 z”′ 必 有 关系 zvz”′>1xf-6G yn。 也 就 是 说 ， 它们 之 间 相 
善 的 倍数 必 某 少 为 17(0-4 7 nm。 所 以 ， 在 每 个 工 | 中 的 元 素数 至 多 为 
log， :mt=lnty 一 Infl 一 芒 ZD] <nlnt / 瓜 
和 禁用 方程 【2.10) 即 可 得 这 个 结果 。 这 个 界 是 给 定 的 输入 值 个 数 mn、 表示 + 所 需 的 位 数 且 
以 及 17 的 和 多项式。 内 为 ApPROX-SUBSET-SUM 的 运行 时 间 为 工 ; 长 度 的 和 多项式 ,所 
以 APPROX-SUBSET-SUM 是 一 个 完全 多 项 式 时 间 的 近似 方案 . 
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37-1 装 箱 


假设 我 们 有 n 个 物体 ， 其 中 第 i 个 的 大 小 满足 0<si<1。 我 们 逢 望 把 所 有 物体 都 装 人 最 
少 的 单位 大 小 的 箱子 中 , 每 个 籍 于 能 容纳 所 有 物体 的 一 个 总 斥 寸 不 大 于 1 的 子 集 。 

a. 证 明 : 确 定 最 少 箱子 个 数 的 问题 是 NE 一 难度 的 (提示 :对 子 集 和 问题 进行 归纳 )。 

“首先 适合 "局 发 式 依 次 考虑 每 个 物体 ， 将 它 放 人 能 容纳 它 的 第 一 个 箱子 。 设 
S= 对 si， 

b, 论证 : 所 需 盒 子 的 最 优 个 数 至 少 为 TS ] 。 

C- 9 首先 适合 启发 式 硅 多 使 一 个 盒子 不 到 半 满 。 

, 证 明 : 由 首先 适合 局 发 式 用 到 的 盒子 数 沁 不 会 大 于 128 1 
尼 ， ， 证 明 首先 适合 启发 式 有 一 比值 界 2。 
f 给 出 首先 适合 启发 式 的 一 个 有 效 实 更 ， 并 分 析 其 运行 时 间 。 


37-2 ”对 最 大 集团 规 横 的 近似 


设 G=(V，E) 为 一 无 向 图 。 对 任意 kz1， 定 义 扎 钙 为 无 向 图 (V 吧 ，E 加 )， 其 
中 V4 是 V 中 顶点 的 所 有 有 序 k 一 元 组 构成 的 集合 ， 王 …… 被 定 文成 〈w，v，…，w)》 与 
(wii，w;，…，wi 部 接 当 县 仅 当 对 某 个 i， 在 避 中 顶点 Y 与 w, 邻接 ， 

a. 证 明 : G 4 中 最 大 集团 的 大 小 等 于 G 中 最 大 集团 的 大 小 的 k 次 宕 。 

b. 论证 : 如果 有 一 寻找 最 大 规模 集团 的 近似 算法 其 比值 界 为 常数 ， 则 对 该 问题 存在 一 
个 完全 多 项 式 时 间 的 近似 方案 。 


37-3 加权 华 合 帮 盖 问题 

假设 我 们 将 集合 材 盖 问 题 加 以 一 般 化 。 使 得 族 F 中 的 每 个 集合 Si 都 有 一 权 w。 而 一 个 
要 益 C 的 权 则 为 忆 、ew: 。 我 们 希望 确定 一 个 具有 最 小 权 值 的 本 盖 。 (37.3 节 中 处 理 了 对 所 
有 的 i，、w;= 1 的 情况 .) 

证 明 : 贪心 集合 禾 盖 启发 式 可 以 以 很 自然 的 方式 加 以 推广 ， 使 之 对 加 权 集 合 构 盖 问 题 的 


任何 实例 都 可 提供 一 个 近似 解 。 请 证 明 : 该 启发 式 有 一 个 比值 界 Htd)， 其 中 上 为 任意 集合 SS 
的 最 大 规模 。 


练习 三 十 七 
37.1-1 请 给 出 一 个 图 的 例子 ， 使 得 APP 有 RDX-VERTEX 一 COYEER 总 是 产生 -个 次 量 优 解 。 
37.1-2 有 大 提出 了 这 样 一 种 解决 顶点 猎头 问题 的 启发 式 : 重复 选择 一 个 具有 最 高 度数 的 顶点 ， 并 去 
掉 所 有 .与 其 英 联 的 边 。 请 给 出 一 个 例子 来 说 明 这 种 店 居 式 不 具有 比值 界 2。 
37.1-3 请 给 出 一 个 能 在 线性 时 间 内 找 出 一 棵 树 的 一 个 最 优 顶 点 覆盖 的 高 效 领 心算 法 . 
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37.1-4 根据 对 定理 36.12 的 证 明 、 我 们 知道 蚀 点 覆盖 问题 和 NP-- 完 全 集团 问题 是 互补 的 ， 因 为 一 个 
县 优 项 点 复读 可 认为 是 持 补 遇 中 一 个 最 大 规模 集团 的 补 。 这 种 关系 基 否 瓯 含 状 集 研 问题 具有 一 个 带 常 煞 比 
值 界 的 近似 算法 ? 


37.2-1 请 说 明 如 何在 多 项 式 时 间 内 将 货 郎 担 问 题 的 一 个 实例 转化 为 另 一 个 其 代价 函数 铜 足 三 角 不 等 
式 的 实例 . 这 两 个 实 例 必 须 有 相同 的 最 优 游历 集合 。 另 迁 解 释 为 什么 这 样 一 种 多 项 式 时 间 的 转换 与 定 
37.3 不 了 矛盾 【 悉 定 P= 上 + 上 NP) . 

37.3-2 和 闭 谍 这 样 一 种 构造 近似 货 郎 投 游 历 的 最 近 点 租 发 式 ， 以 只 包含 一 个 任意 选 出 的 顶点 的 平凡 呵 . 
路 开始 在 竺 .个 步 又 中 ， 定 一 个 不 在 回路 上 、 但 与 回路 上 任何 顶点 的 臣 离 为 最 小 的 顶点 u。 假 设 回路 
上 与 口 最 近 的 需 点 为 Y 通过 将 二 插 人 到 v 的 色 后 面 位 置 来 扩 晨 该 回路 。 重 复 这 个 过 程 直 车 所 有 顶点 都 在 
回路 上 为 止 。 请 让 明 这 种 启发 式 能 返回 一 个 其 总 代价 不 大 于 一 个 最 优 游 启 代价 两 人 的 游历 。 

37.23 ” 瓶 头 货 妇 拒 问题 即 这 样 一 个 问题 : 找 出 一 个 汉密尔顿 回路 ， 使 得 回路 中 最 长 边 的 长 度 最 小 。 候 
定 代 价 函 数 满足 : 角 本 等 式 ， 证 明 这 个 问题 存在 一 个 比值 界 为 3 的 多 项 式 时 间 近 似 算法 。{ 提 示 : 递 扫 地 证 
明 通 过 对 树 进 行 定 全 遍 睫 半 卡 过 某 些 节点 、 伍 不 能 风 过 二 个 连续 的 中 间 节 点 来 保证 对 最 小 生成 树 中 的 所 有 
节点 恰 访 问 一 次 。) 

372_4 假设 货 郎 担 问题 的 某 一 实例 中 的 项 点 为 平面 上 的 点 ， 且 代价 eu， 罗 为 点 口 和 Y 之 间 的 欧 几 
星 德 虑 离 ， 证 明 一 个 最 优 六 历 决 不 念 自我 相交 。 


37.3-1 考 间 以 上 疆 一 个 作为 字 峡 集合 的 单词 : farid，dash，draimn，heard，、1lost，mose，shun， 
slate， snare， threadi， 请 说 明 为 优先 考虑 土 述 单词 中 在 字典 是 排 在 最 前 面 的 而 打 琢 联系 时 
SREEDY-SET-COVER 产生 的 集合 履 盖 。 

37.3-2 通过 对 顶 此 镀 盖 问题 的 化 简 来 证 明 集 合 覆 盖 问 题 的 送 定 版 本 是 NEP- 完 全 的 , 

37.3-3 说 明 如 何 来 实现 GREEDY-SET-COVER, 使 其 运行 时 间 为 DY st slSi) 

37.3-4 证 明 : 下 三 给 出 的 定理 37.4 的 较 遍 形式 为 芯 ， 

IC ImaxiS， 下 1 

37.3-5 请 给 出 一族 伸 合 得 章 的 实例 来 说 明 GREEDY-SET-COVER 能 返回 一 组 与 实例 的 趣 模 成 指 

申 交 系 的 不 同 的 全. 《不 同 的 使 是 直 第 4 行 中 在 选择 8 时 以 不 同方 式 打 琶 联系 时 所 产生 的 ,) 


37.4=-1 证 明 (37.111，。 

37.4-2 证 明 《37,12)7 和 (3713) 。 

37.4-3 对 最 小 的 不 小 上 上 的 给 定 输 入 列表 的 某 个 子 集 和 来 说 ， 要 找到 它 的 一 不 好 的 近似 ， 应 如 何 修 . 
改 这 : - 节 中 介绍 的 近 候 方案 ? 
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